Eksperimentai atskleidžia, kad žmonės pervertina, kiek užtikrintai galima tikėti DI sistemų atsakymais

Dirbtinio intelekto (DI) sistemas, ypač tokius pokalbių agentus kaip „ChatGPT“ ar „Gemini“, kasdien naudoja vis daugiau žmonių visame pasaulyje. Nors daugelis vartotojų pasitiki DI agentų atsakymais į savo užklausas, jie ne visada yra tikslūs ir patikimi.

Eksperimento projekto apžvalga. Autoriai: Clara Colombatto ir Stephen M. Fleming.

Vaterlo universiteto ir Londono universiteto koledžo (University College London, UCL) tyrėjai neseniai atliko tyrimą, kuriuo siekė geriau suprasti, kaip žmonės daro išvadą apie DI agentų ir žmonių pasitikėjimą prognozėmis ar išvadomis. Jų įžvalgos, paskelbtos žurnale „Communications Psychology“, rodo, kad žmonės nuolat suvokia DI sistemas kaip labiau užtikrintas savo atsakymais nei žmonės, net kai jų generuojami atsakymai yra tokie patys, kaip ir žmonių.

„Kadangi DI sistemos tampa vis sudėtingesnės, žmonės vis dažniau į jas kreipiasi patarimų, pavyzdžiui, kokius produktus pirkti ar kokį turinį vartoti“, – „Phys.org“ sakė straipsnio autorė Clara Colombatto.

„Tai atspindi tai, ką darome nuolat bendraudami su kitais žmonėmis, nes dažnai ieškome kitų žmonių patarimų. Vis dėlto yra svarbus skirtumas tarp žmonių patarimų ir dirbtinio intelekto sistemų: kai žmonės duoda patarimus, jie dažnai taip pat praneša, kiek jie pasitiki tuo, ką sako, ir šis pasitikėjimas savo ruožtu formuoja, kiek mes pasitikime ir pasikliaujame patarimais.“

Kaip žmonės priskiria pasitikėjimą kitų atsakymams

Priešingai nei žmonės, dauguma esamų dirbtinio intelekto sistemų, įskaitant modelius, kuriais grindžiamas „ChatGPT“ ir „Gemini“ veikimas, yra sukurtos taip, kad generuotų atsakymus tik į konkrečius klausimus, nenurodant, kiek jie pasitiki savo atsakymais. Šio pasitikėjimo stokos poveikis tam, kiek vartotojai pasitiki dirbtinio intelekto agentų atsakymais, dar nėra aiškiai apibrėžtas.
„Norėjome suprasti, ar žmonės natūraliai daro išvadą, kad pasitiki tiek žmonėmis, tiek dirbtinio intelekto sistemomis, net kai tai nėra tiesiogiai perteikiama, ir kokie veiksniai daro įtaką šiems įverčiams“, – aiškino Colombatto. „Norėdami suprasti, kaip žmonės priskiria pasitikėjimą kitiems agentams, sukūrėme užduotį, kurios metu dalyviai stebėjo žmones arba dirbtinio intelekto sistemas, priimančius sprendimus, ir tada pranešė, kiek, jų manymu, agentas pasitikėjo kiekvienu pasirinkimu.“

Vėliau Colombatto ir jos kolegos išanalizavo surinktus duomenis, kad nustatytų, kaip skirtingos užuominos paveikė pasitikėjimą, kurį dalyviai priskyrė dirbtinio intelekto agentams arba žmonėms. Įdomu tai, kad jie nustatė, jog dalyviai linkę manyti, kad agentai yra labiau pasitikintys savimi, kai jie greitai reaguoja arba kai jiems atrodo, kad sprendimą priimti lengviau.

„Svarbu tai, kad taip pat nustatėme, jog žmonės didesnį pasitikėjimą priskyrė agentams, kuriuos jie laikė tikslesniais ar pajėgesniais, net kai šis įsitikinimas iš tikrųjų nebuvo pagrįstas“, – sakė Colombatto. „Tai ypač svarbu dirbtinio intelekto kontekste, nes žmonės kartais gali manyti, kad dirbtinio intelekto sistemos tam tikras užduotis atlieka geriau nei žmonės, ir todėl daryti išvadą, kad dirbtinis intelektas yra labiau pasitikintis savimi, net kai taip nėra – taip sukuriant „pasitikėjimo dirbtiniu intelektu iliuziją“.

Apskritai šio tyrimo rezultatai rodo, kad žmonėms nereikia agentų, kurie aiškiai perteiktų, kiek jie pasitiki prognoze, kad nustatytų jų pasitikėjimo lygį. Vietoj to, komanda nustatė, kad jų tyrimo dalyviai buvo linkę automatiškai naudoti įvairius ženklus, pavyzdžiui, kaip greitai agentas reagavo ar kiek jis atrodė pajėgus, kad nustatytų savo pasitikėjimą.

„Kritiškai svarbu tai, kad šie ženklai gali būti klaidinantys: kai žmonės mano, kad DI sistema yra labai pajėgi, jie taip pat gali manyti, kad ji yra labai pasitikinti savimi, net jei sistema iš tikrųjų nėra patikima toje konkrečioje situacijoje“, – sakė Colombatto. „Kitaip tariant, žmonių priskyrimai atitinka jų (kartais klaidingus) ankstesnius įsitikinimus apie DI, o ne jo tikrąjį veikimą.“

Implementacija DI projektavimui ir tolesniems tyrimo etapams

Neseniai Colombatto ir jos kolegų atliktas darbas pabrėžia, kaip svarbu kurti DI sistemas, kurios perteiktų vartotojams pasitikėjimą tiek tiesiogiai, tiek per kitus ženklus. Komandos stebėjimai galėtų padėti kurti naujas DI modelių funkcijas, ypač didelius kalbos modelius (LLM), ir padėti tobulinti esamus.

„Žmonių tarpusavio sąveikoje pasitikėjimas yra svarbus socialinis signalas, padedantis mums nuspręsti, kada pasitikėti patarimais, o kada su jais elgtis atsargiau“, – teigė Colombatto. „Mūsų rezultatai rodo, kad kai dirbtinio intelekto sistemos aiškiai nepateikia šios informacijos, žmonės gali patys ją numanyti, o tai turi svarbių pasekmių: jie gali pernelyg pasitikėti dirbtinio intelekto rekomendacijomis, net kai sistema gali būti neaiški arba linkusi į klaidas.“

Šiuo metu tyrėjai planuoja naujus tyrimus, kuriais siekiama padėti žmonėms patikimiau nustatyti dirbtinio intelekto sistemų patikimumą. Konkrečiai, jie norėtų nustatyti perspektyvias strategijas, kaip veiksmingai perteikti vartotojams, kiek dirbtinio intelekto sistemos pasitiki savo prognozėmis.

„Bendradarbiaudami su kitais žmonėmis, mes perteikiame pasitikėjimą įvairiais ženklais, įskaitant balso toną, veido išraiškas, laikyseną ir kt.“, – pridūrė Colombatto. „Tačiau dirbtinio intelekto sistemoms trūksta šių savybių, nes dauguma sistemų neturi į žmones panašių balsų ar fizinio buvimo. Todėl svarbi būsimų tyrimų kryptis bus suprasti, kokie pasitikėjimo signalai yra naudingiausi, skaidriausi ir patikimiausi dirbtinio intelekto ir žmonių sąveikoje.“

Clara Colombatto et al, Beliefs about accuracy shape confidence attributions to humans and artificial agents, Communications Psychology (2026). DOI: 10.1038/s44271-026-00445-4.

Journal information:Communications Psychology

Dirbtinis intelektas ir mokymosi kokybė: kodėl mokymuisi reikia laiko net DI amžiuje?

KTU mokslininkė apie dirbtinio intelekto poveikį smegenims: stebime kognityvinės evoliucijos pradžią

Telefoniniai sukčiai prakalbo lietuviškai: dirbtinis intelektas apgauna net ir pačius budriausius

Dirbtinis intelektas moksle: pagalbininkas ar klaidinantis įrankis?

Nauja priemonė parodo dirbtinio intelekto vaidmenį studentų rašiniuose