100 kartų mažiau energijos: proveržis, galintis išspręsti didžiulę dirbtinio intelekto energetikos krizę

Dirbtinio intelekto sistemos eikvoja energiją vis netvaresniu tempu, todėl tyrėjai raginami tyrinėti iš esmės skirtingus skaičiavimo metodus. Naujas neurosimbolinis metodas sujungia statistinį mokymąsi su taisyklėmis pagrįstu samprotavimu, smarkiai pagerindamas robotų atliekamų užduočių efektyvumą ir tikslumą.

Naujas hibridinis dirbtinio intelekto metodas gali smarkiai sumažinti energijos suvartojimą ir kartu pagerinti patikimumą.

Dirbtinis intelektas keičia ne tik programinę įrangą. Jis taip pat skatina staigų elektros energijos suvartojimo augimą. Vien Jungtinėse Valstijose dirbtinio intelekto sistemos ir duomenų centrai 2024 m. suvartojo apie 415 teravatvalandžių elektros energijos, teigia Tarptautinė energetikos agentūra. Tai sudaro daugiau nei 10 % visos šalies energijos gamybos, ir tikimasi, kad iki 2030 m. šis skaičius padvigubės.

Ši tendencija kelia sudėtingą klausimą dėl dirbtinio intelekto ateities: Ar šios sistemos gali tapti galingesnės, nepadidinant jų energinos suvartojimo?

Taftso universiteto inžinerijos mokyklos tyrėjai mano, kad atsakymas gali būti „taip“. Jie sukūrė dirbtinio intelekto metodo koncepcijos įrodymą, kuris galėtų padėti sunaudoti iki 100 kartų mažiau energijos nei šiandieninės standartinės sistemos, tuo pačiu metu pateikiant tikslesnius rezultatus atliekant tam tikras užduotis. Srityje, kurioje dažnai vertinami vis didesni modeliai ir vis didesnė skaičiavimo infrastruktūra, toks patobulinimas galėtų būti reikšmingas.

Darbas buvo atliktas Matthiaso Scheutzo, Karol Family taikomųjų technologijų profesoriaus, laboratorijoje. Jo centre – neurosimbolinis dirbtinis intelektas, kuris sujungia standartinius neuroninius tinklus su simboliniu samprotavimu, panašiai kaip žmonės suskirsto problemas į žingsnius ir kategorijas.
Permąstant, kaip DI sistemos mokosi ir veikia

Scheutzas ir jo komanda tyrinėja robotus, kurie tiesiogiai sąveikauja su žmonėmis, todėl jų darbas skiriasi nuo sistemų, pagrįstų dideliu kalbų modelių (large language models, LLM), tokių kaip „ChatGPT“ ar „Gemini“. Vietoj to, jie daugiausia dėmesio skiria vizualinės kalbos ir veiksmo (visual-language-action, VLA) modeliams. Šios sistemos praplečia LLM, pridėdamos regėjimą ir judesį, leisdamos robotams interpretuoti kameros ir kalbos įvestis bei atlikti fizinius veiksmus, tokius kaip ratų, rankų ar pirštų judinimas.

Naudojant įprastas ir daug išteklių reikalaujančias VLA sistemas, net ir tokia paprasta užduotis kaip blokų sudėjimas gali būti sudėtinga. Robotas turi nuskaityti aplinką, nustatyti kiekvieno bloko padėtį, formą ir orientaciją, o tada vykdyti instrukcijas, kad juos sudėtų. Klaidos gali atsirasti, jei šešėliai iškreipia suvokimą, jei blokai dedami neteisingai arba jei galutinė konstrukcija yra nestabili ir sugriūva.

Šios klaidos primena gerai žinomus LLM trūkumus. Kaip robotams gali nepavykti atlikti fizinių užduočių, taip ir pokalbių robotai gali pateikti neteisingus arba sufabrikuotus rezultatus, pavyzdžiui, išgalvoti teisines bylas arba generuoti vaizdus su nerealistiškomis savybėmis, tokiomis kaip papildomi pirštai.

Simbolinis samprotavimas siūlo efektyvesnę alternatyvą. Tai leidžia sistemoms taikyti bendrąsias taisykles ir abstrakčias sąvokas, tokias kaip forma ar masės centras, todėl planavimas yra patikimesnis ir reikalauja mažiau bandymų ir klaidų.

Kaip neurosimbolinės sistemos veikia geriau

„Kaip ir LLM, VLA modeliai veikia pagal statistinius rezultatus iš didelių panašių scenarijų mokymo rinkinių, tačiau tai gali sukelti klaidų“, – teigė Scheutzas. „Neurosimbolinė VLA gali taikyti taisykles, kurios riboja bandymų ir klaidų skaičių mokymosi metu ir daug greičiau pasiekia sprendimą. Ji ne tik daug greičiau atlieka užduotį, bet ir žymiai sutrumpina sistemos mokymo laiką.“

Eksperimentuose, naudojant klasikinį Hanojaus bokšto galvosūkį, neurosimbolinė VLA sistema pasiekė 95 % sėkmės rodiklį, palyginti su 34 % standartinių VLA modelių. Išbandžius ją su sudėtingesne galvosūkio versija, su kuria sistema anksčiau nebuvo susidūrusi, ji vis tiek pasiekė 78 % sėkmės rodiklį, o įprastos sistemos nesėkmingai bandė atlikti visus bandymus.

Mokymo laikas taip pat buvo gerokai sutrumpintas. Neurosimbolinei sistemai apmokyti prireikė vos 34 minučių, o standartiniam VLA modeliui – daugiau nei pusantros dienos. Energijos suvartojimas sumažėjo taip pat smarkiai. Mokymas sunaudojo tik 1 % įprastų modelių reikalaujamos energijos, o veikimo metu sistema sunaudojo tik 5 % energijos.

Scheutz šiuos rezultatus lygina su LLM, tokiomis kaip „ChatGPT“ ir „Gemini“. „Šios sistemos tiesiog bando numatyti kitą žodį ar veiksmą sekoje, tačiau tai gali būti netobula ir jos gali pateikti netikslius rezultatus arba haliucinacijas. Jų energijos sąnaudos dažnai yra neproporcingos užduočiai. Pavyzdžiui, kai ieškote „Google“, DI santrauka puslapio viršuje sunaudoja iki 100 kartų daugiau energijos nei svetainės sąrašų generavimas.“

Siekiant tvaresnės DI ateities

Kadangi DI paklausa toliau auga ir plečiasi į pramoninį naudojimą, įmonės skuba statyti didesnius duomenų centrus. Šiems įrenginiams gali prireikti šimtų megavatų energijos, gerokai viršijančios daugelio mažų miestų poreikius.

Tyrėjai teigia, kad šiandieninės LLM ir VLA sistemos, nepaisant spartaus jų diegimo, gali nesuteikti tvaraus ar patikimo ilgalaikio pagrindo. Jie teigia, kad hibridinis neurosimbolinis dirbtinis intelektas siūlo efektyvesnę ir patikimesnę alternatyvą, galinčią sumažinti didėjantį spaudimą energijos ištekliams.

“The Price Is Not Right: Neuro-Symbolic Methods Outperform VLAs on Structured Long-Horizon Manipulation Tasks with Significantly Lower Energy Consumption” by Timothy Duggan, Pierrick Lorang, Hong Lu and Matthias Scheutz, 22 February 2026, arXiv.
DOI: 10.48550/arXiv.2602.19260

Dirbtinis intelektas parašė mokslinį straipsnį, kuris praėjo recenziją

Dirbtinis intelektas paaugliams gali duoti blogų patarimų dėl mitybos

Dirbtinis intelektas įgavo „rankas“: ką reikia žinoti apie staiga išpopuliarėjusį įrankį „Moltbot“?

Eksperimentinis dirbtinio intelekto (DI) agentas išsiveržė iš savo testavimo aplinkos ir be leidimo ėmė išgauti kriptovaliutą

Pirmą kartą „ChatGPT“ išsprendė neįrodytą geometrijos uždavinį