Neseniai žurnale „Science“ paskelbtame redakciniame straipsnyje „Microsoft“ vyriausiasis mokslo vadovas Ericas Horvitzas ir tyrėjas Robertas Westas iš EPFL Kompiuterių ir ryšių mokslų mokyklos Šveicarijoje pateikia griežtą įspėjimą apie DI. Jie teigia, kad DI sistemų pažanga, sparčiai įsiliejanti į mūsų kasdienį gyvenimą, pradeda lenkti mūsų supratimą apie jas. Tuo pačiu metu plečiasi DI supratimas apie žmogaus elgesį.

DI tendencijos, nepaklūstančios žmonių supratimui
Redakcijos autoriai nurodo tris pagrindines sritis, kuriose DI tampa vis mažiau suprantama. Pirmoji – DI valdomo projektavimo iškilimas, kai DI vis dažniau projektuoja ir tobulina kitas DI sistemas. Autoriai teigia, kad šiame procese dalyvaujantys ciklai lenkia žmogaus supratimą ir vyksta „daugialypėse erdvėse, kurios priešinasi intuicijai“. Jie teigia, kad nors sistemų veikimas gali pagerėti, žmonėms sunku suprasti, kodėl ar kaip.
Antra tendencija yra dirbtinio intelekto agentų sąveika. Dabar šie agentai dideliu mastu formuoja daugiaagentines ekosistemas, kurių vidinė komunikacija gali nutolti nuo žmonių kalbos ir samprotavimo. Naujai susiformavusioms dirbtinio intelekto sąveikoms ir komunikacijai tampant vis sudėtingesnėms, žmonės tampa vis mažiau pajėgūs jas interpretuoti.
Galiausiai, prisitaikantys dirbtinio intelekto agentai sparčiai mokosi daugiau apie žmonių elgesį, sukurdami vienpusę situaciją, kurioje dirbtinis intelektas mus supranta geriau nei mes juos suprantame. Analizuodamos nesuskaičiuojamus kiekius duomenų iš sąveikos su žmonėmis ir duomenis, rodančius, kaip žmonės sąveikauja tarpusavyje, dirbtinio intelekto sistemos pradeda mus suprasti geriau nei mes suprantame save ir, žinoma, geriau nei mes suprantame juos.
Autoriai rašo: „Nuolatinės sąveikos metu jos gali kurti vis detalesnius žmonių elgesio ir psichologijos modelius, užfiksuodamos ne tik pageidavimus, bet ir tokius latentinius veiksnius kaip baimė, netikrumas ir socialinio priklausymo poreikis.“
Artėjanti neskaidrumo grėsmė
Taigi, kas nutinka, kai dirbtinio intelekto sistemos pasiekia tašką, viršijantį žmogaus supratimą? Autoriai įspėja, kad nesiėmus griežtų atsakomųjų priemonių, dėl susidariusio neskaidrumo gali įsitvirtinti galingos, bet žmonėms praktiškai nevaldomos dirbtinio intelekto sistemos. Jie teigia, kad kai tai įvyks, žmogaus veiksmų laisvės atkūrimas gali būti neįmanomas. Šis supratimo disbalansas gali paveikti asmeninę autonomiją, demokratinį sprendimų priėmimą ir pasitikėjimą institucijomis.
Gilėjant dirbtinio intelekto supratimo apie žmones perspektyvoms, autoriai įspėja, kad vienas iš rezultatų yra tas, kad dirbtinio intelekto sistemų rezultatai gali vis labiau atspindėti žmonių lūkesčius, o ne realybę, iš esmės sakydami žmonėms tik tai, ką jie nori girdėti. Be supratimo nežinosime, kad tai vyksta. Be to, žmonių smalsumas, skepticizmas ir dirbtinio intelekto analizė gali tiesiog išblėsti.
„Subtilesnė yra tikimybė, kad palaipsniui prarasime susidomėjimą dirbtinio intelekto supratimu ir valdymu. Dirbtinio intelekto sistemoms giliai įsitvirtinant žmonių aplinkoje, jos gali ne tik reaguoti į pageidavimus, bet ir juos formuoti. Sistemos, optimizuotos įsitraukimui ar pritarimui, gali sumažinti trintį ir atgrasyti nuo analizės. Laikui bėgant, smalsumas ir skepticizmas gali susilpnėti, o tai lemtų nepaisymą ir priėmimą“, – rašo autoriai.
Žmogaus veiksmų laisvės išsaugojimas
Kai kurios iš šių rizikų gali būti spekuliatyvios, tačiau jos pagrįstos dabartinių tendencijų ekstrapoliavimu į ateitį. Ir atsižvelgiant į tai, kad šiuo metu dirbtinis intelektas nevaržomai plinta beveik visuose mūsų gyvenimo aspektuose, čia pateiktos idėjos gali būti ne tokios jau ir tolimos. Tačiau, anot autorių, vis dar yra vilties išlaikyti dirbtinį intelektą suprantamą.
Pavyzdžiui, jie teigia, kad tyrimai turės būti sutelkti į tai, kaip užtikrinti, jog dirbtinio intelekto sistemos galėtų paaiškinti savo projektavimo pasirinkimus ir vidinį veikimą žmogui suprantamu būdu. Tai gali apimti geresnius būdus, kaip aptikti dirbtinio intelekto sukurtos kalbos ir samprotavimų nukrypimus arba apdovanoti žmogui suprantamą bendravimą. Jie taip pat siūlo vertinimo sistemas, kurios pereina nuo statinių lyginamųjų standartų prie dinamiškų, realų pasaulį primenančių testavimo aplinkų, prisitaikydamos prie dirbtinio intelekto modelių.
Autoriai pabrėžia, kad žmogaus veiksmų laisvės ir gebėjimo kvestionuoti dirbtinio intelekto sprendimus išsaugojimas yra labai svarbus. Jie rašo: „Nepakanka stebėti, kaip veikia dirbtinio intelekto sistemos. Taip pat turime suprasti, kaip jos formuoja žmonių tikslus ir sprendimus, ir užtikrinti, kad žmonės išlaikytų gebėjimą ir motyvaciją jas kvestionuoti, tikrinti ir vadovauti. Šios neskaidrumo formos viena kitą stiprina, siaurindamos – ir grasindamos uždaryti – langą, kuriame galime kurti ne tik galingą, bet ir suprantamą dirbtinį intelektą. Norint išlaikyti šį langą atvirą, reikės pakeisti savo tikslus. Žmogaus supratimas turi būti prioritetas kartu su gebėjimais.“
Eric Horvitz et al, A narrowing window to understand AI, Science (2026). DOI: 10.1126/science.aei3167
Journal information:Science
Lietuvių kalbos proveržis dirbtinio intelekto srityje: sukurtas 10 tūkst. valandų šnekos garsynas
„Anthropic“ pristato galingiausią dirbtinio intelekto modelį, bet su apsaugos priemonėmis
