Dirbtinio intelekto sistemoms augant ir stiprėjant, jų energijos poreikiai smarkiai auga. Tačiau naujausi Masačusetso Amhersto universiteto tyrimai, paskelbti žurnale „Nature Communications“, rodo, kad pažangios DI galimybės gali būti pasiekiamos sunaudojant gerokai mažiau energijos.
Amhersto Masačusetso universiteto Manningo informacijos ir kompiuterių mokslų koledžo profesorės Havos Siegelmann vadovaujama komanda sukūrė naują DI, kuris labiau atspindi pagrindinius žmogaus smegenų veikimo aspektus. Siegelmann ir jos laboratorija sutelkė dėmesį į du vienas kitą papildančius tikslus: sudaryti sąlygas DI sistemoms nuolat mokytis realiuoju laiku, o ne tik fiksuoto mokymo etapo metu, ir smarkiai sumažinti intelektualiems skaičiavimams reikalingą energiją.
„Dabartinės DI sistemos yra nepaprastai galingos, tačiau jos taip pat eikvoja labai daug energijos “, – sakė Siegelmann. „Mūsų darbas rodo, kad įmanoma sukurti DI, kuris išliktų labai pajėgus, tuo pačiu metu veikdamas daug efektyviau.“
Kontrastas su žmogaus smegenimis yra ryškus. Remiantis Nacionalinių sveikatos institutų duomenimis, žmogaus smegenyse yra maždaug 86 milijardai neuronų, veikiančių lygiagrečiai, ir sunaudojančių maždaug 20 vatų energijos – maždaug tiek pat, kiek LED lemputė. Palyginimui, didžiausių dirbtinio intelekto modelių mokymas gali pareikalauti dešimčių milijonų vatų energijos ir užimti didžiulę duomenų centro infrastruktūrą.
Viena iš priežasčių, kodėl žmogaus smegenys veikia taip efektyviai, yra ta, kad jos funkcionuoja asinchroniškai. Dalyvaudami konkrečioje užduotyje arba „atnaujindami“ save, suaktyvėja tik nedidelė smegenų neuronų dalis. Tai leidžia atsirasti sudėtingam elgesiui sunaudojant itin mažai energijos.
Skirtingai nuo biologinių smegenų, kurios veikia daugiausia asinchroniškai, šiandieninės giliųjų tinklų dirbtinio intelekto sistemos, įskaitant „ChatGPT“ ir „Claude“, remiasi labai sinchronizuotais skaičiavimais milijonuose ar milijarduose dirbtinių neuronų. Atnaujinimai vyksta vienu metu ir juos valdo bendras laikrodis, nepriklausomai nuo pagrindinės užduoties. Šiandieniniai tinklai turi atlikti didelius skaičiavimus, kuriems reikia daug energijos, vien tam, kad išlaikytų sinchronizuotą veikimą.
„Šis sinchronizuotas metodas gerai veikė, kol neuroniniai tinklai buvo santykinai maži“, – aiškino Siegelmann. „Tačiau dirbtinio intelekto sistemoms išaugus iki milijardų ir net trilijonų parametrų, energijos poreikiai tapo vis brangesni, ekologiškai reikšmingesni ir nepraktiškesni autonominėms sistemoms, tokioms kaip robotai.“
„Tyrėjai anksčiau tyrinėjo asinchroninius neuroninius tinklus su impulsu kaip būdą padidinti energijos vartojimo efektyvumą“, – tęsė ji, – „tačiau jie rado didelių mokymosi ir prisitaikymo kliūčių, nes mokymo procedūros, kurios veikia su impulsu veikiančiomis architektūromis, yra daug prastesnės nei gradientiniai mokymo metodai, įskaitant atgalinį sklidimą, kuris padarė šiuolaikinius giliuosius neuroninius tinklus tokius sėkmingus.“
Kaip veikia ANT
Nauja Siegelmann tyrimų komanda siekė sujungti abiejų metodų privalumus.
Rezultatas – ANT – Asinchroniniai Neuroniniai Turingo tinklai – nauja architektūra, kuri pašalina globalios sinchronizacijos poreikį, išsaugant diferencijuojamas neuronines savybes, dėl kurių gilieji neuroniniai tinklai yra labai lengvai apmokomi.
„Pagrindinis iššūkis buvo pašalinti sinchronizuojantį bendrą laikrodį neaukojant skaičiavimo galios ar prisitaikymo“, – sakė Siegelmann. „Sukūrėme naujus projektavimo principus, kurie leidžia išsaugoti informaciją asinchroninių atnaujinimų metu, išlaikant galingas mokymosi galimybes.“
Kadangi ANT atnaujina tik tuos neuronus, kurių reikia kiekviename skaičiavimo etape, jis gali sumažinti energijos suvartojimą keliomis eilėmis.
Siegelmann tęsė: „Iš principo ANT gali prilygti įprastų skaitmeninių sistemų ir šiuolaikinių giliųjų neuroninių tinklų skaičiavimo galiai, tuo pačiu veikdamas efektyviai.“
Kas toliau?
Šis darbas remiasi ilgalaikiu Siegelmann indėliu į teorinius neuroninius skaičiavimus, įskaitant jos svarbią 1995 m. demonstraciją, kad pasikartojantys neuroniniai tinklai turi skaičiavimo galimybes, panašias į Turingo mašinas.
Tyrimų komanda dabar dirba siekdama dar labiau pagerinti ANT energijos vartojimo efektyvumą ir išplėsti jo galimybes nuolatiniam mokymuisi realiuoju laiku.
Siegelmann tikisi, kad naujoji sistema paskatins platesnį dirbtinio intelekto sistemų, kurios yra ne tik tvaresnės, bet ir prisitaikančios bei potencialiai pajėgesnės nei šiandien dominuojančios architektūros, tyrinėjimą.
Be to, kad sumažina dirbtinio intelekto poveikį aplinkai, šis metodas gali būti ypač vertingas intelektualioms autonominėms sistemoms, veikiančioms esant griežtiems energijos apribojimams, įskaitant robotus, periferinius kompiuterinius įrenginius, autonomines transporto priemones ir ateities prisitaikančio mašininio intelekto kartas.
Hava T. Siegelmann et al, Turing universal neural networks do not require global clocks, Nature Communications (2026). DOI: 10.1038/s41467-026-73830-6
Journal information:Nature Communications
NASA naujasis dirbtinio intelekto kosminis lustas galėtų leisti erdvėlaiviams mąstyti patiems
Dirbtinis intelektas ir mokymosi kokybė: kodėl mokymuisi reikia laiko net DI amžiuje?
Nematomas skaitmeninis pėdsakas: ar žinome, kiek kainuoja viena dirbtinio intelekto užklausa?
