„Anthropic“ perspėja, kad dirbtinis intelektas netrukus gali pradėti tobulinti pats save. Kritikai tuo neįsitikinę

„Claude“ kūrėja nori, kad dirbtinio intelekto laboratorijos, įskaitant ir ją pačią, pasiruoštų koordinuotam sulėtėjimui, jei modeliai patys pradėtų save tobulinti.

Chris Stokel-Walker

Pažangios dirbtinio intelekto sistemos priklauso nuo didžiulės skaičiavimo infrastruktūros, todėl sunku stebėti ar užtikrinti tokių sistemų sulėtinimą.

Sameer Al-Doumy / AFP / „Getty Images“

Viena sparčiausiai besivystančių DI bendrovių teigia, kad dirbtinio intelekto priešakyje esančios įmonės turėtų būti pasiruošusios sulėtinti tempą.

„Anthropic“, „Claude“ pokalbių roboto kūrėja, teigia, kad dirbtinio intelekto sistemos gali būti ant vadinamojo rekursinio savęs tobulinimo slenksčio – taško, kai jos gali pradėti kurti savo įpėdinius beveik be žmogaus indėlio. Bendrovė teigė, kad tai gali padidinti riziką, jog žmonės praras technologijos kontrolę.

„Manome, kad pasauliui būtų naudinga turėti galimybę sulėtinti arba laikinai pristabdyti dirbtinio intelekto plėtrą pažangiose srityse, kad visuomeninės struktūros ir tyrimai neatsiliktų nuo technologijų pažangos“, – birželio 4 d. tinklaraščio įraše „Kai dirbtinis intelektas kuria pats save“ teigė „Anthropic“.

Pasiūlymas išryškina sudėtingą dirbtinio intelekto valdymo problemą. Sulėtinus augimą, konkuruojančios įmonės ir šalių vyriausybės turėtų prisiimti tuos pačius apribojimus, nesant jokios jas įpareigojančios sutarties, o konkurencija tik stiprėtų. Dėl to šis įspėjimas yra techniškai svarbus ir politiškai sudėtingas: „Anthropic“ paragino stabdyti lenktynes, kuriose ji išlieka lydere.

Tinklaraščio įraše teigiama, kad technologijų plėtros greitis gali turėti „didžiulių pasekmių“ visuomenei. Bendrovė savo veiklą nurodė kaip įspėjamąjį ženklą. „Anthropic“ teigė, kad Claude’as dabar rašo daugiau nei 80 procentų kodo, integruoto į jos sistemas, palyginti su vos keliais procentais iki tol, kol bendrovė išleido Claude kodą 2025 m. pradžioje. „Anthropic“ pridūrė, kad jos inžinieriai per ketvirtį sukuria maždaug aštuonis kartus daugiau kodo nei prieš kelerius metus. Bendrovė teigė, kad kiekviename dirbtinio intelekto kūrimo etape žmogaus vaidmuo mažėja. „Mes dar nepasiekėme to taško, ir rekursinis savęs tobulinimas nėra neišvengiamas“, – teigė bendrovė. „Tačiau tai gali įvykti anksčiau, nei dauguma institucijų bus pasiruošusios.“

„Anthropic“ pasiūlė tai, ką pavadino „pasauliniu koordinavimo mechanizmu“, skirtu sulėtinti ar net pristabdyti dirbtinio intelekto plėtrą ir suteikti visuomenei erdvės pasivyti.

„Anthropic“ pranešime trūko konkrečių detalių. Kaip galimą modelį ji nurodė ginklų kontrolės susitarimus dėl vidutinio nuotolio branduolinių raketų. Pasak jos, kad tokia pauzė išliktų, joje turėtų dalyvauti pirmaujančios pramonės laboratorijos ir kad reikėtų patikimo būdo įrodyti, jog jos iš tikrųjų sulėtino tempą.

„Nemanau, kad tai nuoširdus raginimas sulėtinti tempą“, – sako Noah Giansiracusa, Bentley universiteto matematikos docentas ir dviejų knygų apie algoritmus ir visuomenę autorius. „Skaitėme „Anthropic“ generalinio direktoriaus Dario Amodei tinklaraščio įrašus. Manau, kad jis nori toliau judėti į priekį visu greičiu.“

„Anthropic“ neatsakė į „Scientific American“ klausimus apie tai, kaip toks stabdys veiktų ar kaip bendrovė vertina kritiką, kad ji pervertino savo sistemų galimybes.

Giansiracusa taip pat mano, kad pauzė yra neįgyvendinama. „Tai tiesiogine prasme neįmanoma“, – sako jis. „Nulinė tikimybė, kad bus sulėtėjimas. Net nekalbu apie Kiniją – vien Elonas Muskas niekada nesulėtintų tempo.“

Šis pasiūlymas atitinka modelį, kuris kai kuriems tyrėjus kelia abejonių. Prieš du mėnesius „Anthropic“ pristatė modelį pavadinimu „Mythos“ , kurį atsisakė viešai skelbti, teigdama, kad modelis pernelyg gerai aptinka programinės įrangos pažeidžiamumus. Raginimas sustabdyti veiklą taip pat pasirodė praėjus vos kelioms dienoms po to, kai „Anthropic“ konfidencialiai pateikė paraišką dėl pradinio viešo akcijų siūlymo (IPO) ir netrukus po finansavimo etapo, kurio metu bendrovės vertė siekė beveik 1 trilijoną dolerių.

Skeptikams tokie stulbinantys pareiškimai gali būti suprantami kaip verslo strategija – būdas atkreipti reguliavimo institucijų dėmesį į ribą, o „Anthropic“ toliau lenktyniauja eidama jos link. Markas Riedlas, Džordžijos technologijos instituto Interaktyviosios kompiuterijos mokyklos profesorius, „Bluesky“ teigia , kad „didelės dirbtinio intelekto bendrovės šoka į „rekursyvaus savęs tobulinimo“ ažiotažo traukinį“.

„Anthropic“ teigia, kad ateinančius mėnesius kvies vyriausybes, tyrėjus ir konkuruojančias dirbtinio intelekto bendroves, kad išsiaiškintų, ar koordinuotas sulėtinimas galėtų veikti praktiškai.

„Aš iš tikrųjų nematau priežasties nerimauti“, – sako Giansiracusa. „Jie flirtuoja su singuliarumo idėja – kad tai keičia žaidimo taisykles, o aš to tiesiog nematau. Matau, kad tai toliau progresuoja. Galbūt viskas paspartės, o galbūt ne.“ „Anthropic“ pateikti įrodymai – daugiau dirbtinio intelekto parašyto kodo – rodo, kad technologija, anot jo, yra naudinga, o nėra „didelis šuolis“.

Scientific American

Dirbtinis intelektas (DI) žurnalistinę kalbą daro labiau pasikartojančią ir nuspėjamą – ir tai yra visų mūsų problema.

Mokslininkai kuria išmanius sprendimus ūkiams: dirbtinis intelektas padės anksčiau aptikti gyvūnų ligas

Dirbtinis intelektas moksle: pagalbininkas ar klaidinantis įrankis?

Dirbtinis intelektas parašė mokslinį straipsnį, kuris praėjo recenziją

Ateities komitete diskutuota apie švietimo sistemos pertvarkos kryptis dirbtinio intelekto epochoje