Dirbtinis intelektas (DI) žurnalistinę kalbą daro labiau pasikartojančią ir nuspėjamą – ir tai yra visų mūsų problema.

Kas nutinka kalbai, kai vis daugiau teksto, publikuojamo spaudoje, internete ir socialinėje žiniasklaidoje, rašo mašinos? Šis klausimas svarbus ne tik žurnalistikos profesijai – jis taip pat turi įtakos kalbos, kurią visi vartojame suprasdami, apibūdindami ir aptardami pačią realybę, turtingumui.

laikrasciai

Istoriškai spauda buvo erdvė, kurioje viešoji kalba auga ir turtėja. Žinoma, tai ne vienintelis kalbinių pokyčių variklis, tačiau tai viena iš sričių, kurioje visuomenėje pradeda cirkuliuoti nauji ar atsirandantys žodžiai, posakiai ir faktų apibūdinimo būdai.

Žurnalistinės kalbos ir neologizmų tyrimai aiškiai rodo, kad laikraščiai yra platformos naujam žodynui kurti ir skleisti, ypač kai reikia pranešti apie įvykius, technologijas ir socialinius pokyčius plačiai auditorijai.

Tačiau, jei didelė dalis žurnalistinio rašymo bus deleguota generatyviniam DI, šis vaidmuo sumažės. Dideli kalbos modeliai (LLM) paprastai veikia numatydami kitą žodį sekoje. Tai leidžia jiems kurti sklandų ir įtikinamą tekstą, tačiau kartu suteikia jiems polinkį teikti pirmenybę statistiniam reguliarumui, taip pat įprastiems, nusistovėjusiems argumentams ir formuluotėms.

Pats savaime toks būdas tai nesumenkina kalbos. Problema kyla, kai ši logika pradeda dominuoti rašant viešojoje erdvėje.

DI grįžtamojo ryšio ciklas

Rizika tampa rimta, kai DI sistemos pradeda mokytis iš DI jau sukurtų tekstų. Tai veda prie to, ką daugelis tyrimų vadina „modelio žlugimu“ – degeneraciniu procesu, kai vieno modelio sukurta medžiaga užteršia vėlesnių kartų mokymo duomenis.

Paprastai tariant, tai reiškia, kad DI sistemos vis daugiau mokosi iš sintetinio teksto. Jei šie tekstai užpildys viešąsias erdves – tiek internete, tiek popieriuje – verbalinė ekosistema būsimam mokymui bus daug labiau susiaurinta.

Didesnis dirbtinio teksto kiekis reiškia mažesnį sąlytį su socialine įvairove, kuri yra būdinga žmogaus kalbai. Tai gali lemti lingvistinį nuosmukį keliose srityse.

Tai taip pat įtvirtina esamus šališkumus ir išankstinius nusistovėjimus. Kai duomenų įvairovė sumažėja ir vyrauja nusistovėję modeliai, mokymo medžiagos šališkumai gali būti sustiprinti, o ne ištaisyti. Tyrimai apie LLM šališkumo evoliuciją įspėja, kad rekursyvūs procesai gali sustiprinti esamus išankstinius nusistatymus, užuot praplėtę perspektyvas.

Be to, rašymas tampa vis labiau pasikartojantis ir homogenizuotas. Jame kartojamos sintaksės struktūros ir linkstama prie neutralaus tono, formulinių išraiškų ir nuspėjamų pastraipų struktūrų. Tai ypač svarbu žurnalistikoje, nes spauda egzistuoja ne tik tam, kad transliuotų informaciją – ji taip pat tarpininkauja tarp specializuotų ir lengviau prieinamų registrų, nusprendžia, kur dėti akcentus, pildo žodyną ir moko išraiškos formų.

Kai viešoji kalba tampa pernelyg vienoda, tai riboja žurnalistikos galimybes tiksliai suderinti rašymą reaguojant į naują informaciją.
Kalbos inovacijų nykimas

Visa tai lemia neįprastų ar specializuotų žodžių, retesnių konstrukcijų ir pragmatinių niuansų skaičiaus sumažėjimą – terminas, apimantis tokias priemones kaip ironija, dviprasmybė ir požiūrio taškų įvairovė. Didėjantis sintetinio teksto naudojimas dirbtinio intelekto mokymuose taip pat susijęs su našumo sumažėjimu ir ribota žmonių kalbos įvairovės aprėptimi. Paprastai tariant, sistema geriau išsaugo centrą nei pakraščius.

Tačiau kalboje daugelis inovacijų prasideda nuo chaotiškų nukrypimų, netikėto žodžių vartojimo arba lokalizuotų naujo reiškinio įvardijimo būdų. Jei sistema visada pirmenybę teikia statistiškai labiausiai tikėtinam variantui, tai reiškia, kad atsirandančiai kalbai lieka mažiau erdvės cirkuliuoti ir įsitvirtinti.

Šio punkto nereikėtų suprasti kaip kažkokios abstrakčios dichotomijos tarp žmogaus ir mašinos, o kaip konkretaus skirtumo – tarp kalbos, kuriai daro įtaką atsitiktiniai žmonių visuomenės įvykiai, ir tekstinės išvesties, gautos iš iš anksto išmokto reguliarumo.

Blogėjančios viešosios kalbos ekosistemos

Tai ne tik mažesnio skirtingų žodžių skaičiaus klausimas, bet ir sumažėjusio gebėjimo daryti subtilius skirtumus klausimas. Kai kalba tampa miglotesnė, labiau nuspėjama ar pasikartojanti, ji taip pat nuskurdina įrankius, kuriuos mes, kaip visuomenė, naudojame problemoms apibūdinti, nuomonėms aiškinti ir dalyvauti viešose diskusijose.

Platesniu mastu problema neapsiriboja tuo, kas nutinka su dirbtinio intelekto modeliais, apmokytais šiais duomenimis, bet ir tuo, kas nutinka viešosios kalbos ekosistemai. Jei internetas prisipildys sintetinio teksto, skaitytojai, žurnalistai ir institucijos susidurs su mažiau įvairia viešąja kalba.

Kai kuriuose tyrimuose taip pat kalbama apie tai, kad sintetinis tekstas „teršia“ internetinę ekosistemą, ir tai rodo, kad tai, kaip mes maišome tikrus duomenis su dirbtiniais duomenimis, yra gyvybiškai svarbu siekiant užkirsti kelią tolesniam nuosmukiui.

Ne viskas prarasta

Nepaisant viso to, neturėtume pernelyg nuliūsti. Tyrimai neparodo, kad bet koks dirbtinio intelekto naudojimas neišvengiamai veda prie nuosmukio ar žlugimo. Kai kurie tyrimai rodo, kad kai sintetiniai duomenys maišomi su tikrais duomenimis, o ne visiškai pakeičiami, žlugimas neveikia taip pat ir klaidas galima suvaldyti.

Kitaip tariant, problema slypi ne tame, kad kartais naudojamas dirbtinis intelektas, ar protingame sintetinių ir žmonių duomenų derinyje. Tai įvyksta, kai žmonių raštas masiškai pakeičiamas, o jo pakaitalas vėliau pritaikomas taip, tarsi tai būtų gyva kalba.

Dirbtiniam intelektui tampant žurnalistų darbo gyvenimo dalimi, žurnalistika tampa efektyvesnė. Tačiau ką praranda visuomenė, kai viešojoje erdvėje cirkuliuojanti kalba tampa vienodesnė ir nuspėjamesnė, mažiau atvira inovacijoms?

Jei spauda bent iš dalies atsisakys savo vaidmens rašyti, versti, įvardyti ir mokyti naujų kalbų, tai paveiks ne tik žurnalistų darbo dienas. Tai taip pat susilpnins vieną iš erdvių, kurioje viešoji kalba labiausiai galėjo praturtėti, atsinaujinti ir plėstis.

The Conversation

Dirbtinis intelektas ir mokymosi kokybė: kodėl mokymuisi reikia laiko net DI amžiuje?

Dirbtinis intelektas moksle: pagalbininkas ar klaidinantis įrankis?

Nauji „DI mokslininkai“ tobulėja, tačiau atsiskleidžia ir esminės ribos

Investicijų strategas: dirbtinis intelektas keičia finansų rinkas, bet didina ir rizikas