Nauji „DI mokslininkai“ tobulėja, tačiau atsiskleidžia ir esminės ribos

Daugelis įdomiausių mokslo atradimų apima labai specializuotas žinias ir sąsajų tarp tolimų faktų paiešką. Mokslininkai turi derinti gilią analizę su plačiomis samprotavimo strategijomis.

Kaip ir daugelyje informacijos gausos reikalaujančių užduočių, tyrėjai ieško dirbtinio intelekto (DI) sistemų, kad paspartintų savo darbą. DI įrankiai gali padėti atlikti pagrindinius veiksmus, tokius kaip idėjų generavimas, esamo darbo peržiūra ir duomenų analizė.

Naujausios sistemos naudoja didelius kalbos modelius (LLM), kad mokslininkai galėtų natūraliai ir tiesiogiai sąveikauti su didžiuliu žinių kiekiu, užfiksuotu žodžiais mokslinėje literatūroje.

Tačiau, kaip rodo dvi naujos sistemos, ką tik aprašytos žurnale „Nature“ paskelbtuose straipsniuose, kalbant apie mokslą, vien kalba gali padėti tik iki tam tikro lygio.

Ką DI daro mokslui

Daugelis organizacijų, tokių kaip „Sakana AI“, bando automatizuoti visą mokslinį procesą. Iki šiol šios pastangos daugiausia buvo sutelktos į kompiuterių mokslą, kur „eksperimentai“ daugiausia apėmė kodo kūrimą ir rašymą.

Tačiau praėjusį spalį Stanforde surengtoje „Agents4Science“ konferencijoje buvo pristatytas platesnis dirbtinio intelekto sugeneruotų straipsnių spektras. Juose buvo aptartos temos – nuo mechanikos inžinerijos ir baltymų dizaino iki sistemos, vadinamos „BadScientist“, kuri sąmoningai pateikė „įtikinamus, bet nepagrįstus“ tyrimus.

Anksčiau esu išreiškusi susirūpinimą dėl dirbtinio intelekto mokslininkų poveikio mokslo ekosistemai. Naujausi darbai patvirtina šiuos nuogąstavimus, rodantys padidėjusį straipsnių ir kolegų atsiliepimų kiekį, bet prastesnę kokybę, suklastotų nuorodų nustatymą publikuotuose darbuose, suklastotų ir klaidinančių vaizdų radimą ir kt.

Ką mokslininkai daro su dirbtiniu intelektu

Akivaizdu, kad dirbtinio intelekto sistemomis negalima pasitikėti, kad jos pačios atliks visą mokslo procesą. Bet kaip būtų galima panaudoti dirbtinį intelektą, kad mokslininkai galėtų nuveikti daugiau ir greičiau?

Toks yra dviejų naujų sistemų, aprašytų žurnale „Nature“, tikslas: „Robin“, kurią sukūrė ne pelno siekianti „Future House“, ir „Co-Scientist“, kurią sukūrė „Google DeepMind“.

Abi sistemos siekia paspartinti mokslinius atradimus, bendradarbiaujant su mokslininku. Abi sistemos taip pat yra „daugiagentės“ dirbtinio intelekto sistemos, tai reiškia, kad jos sukurtos kaip specializuotų agentų rinkinys, kurių kiekvienas skirtas konkretiems mokslinio atradimo proceso etapams, o juos koordinuoja „prižiūrintis“ agentas.

„Co-Scientist“ agentai siekia atspindėti abstrakčias kognityvines užduotis, pavyzdžiui, „refleksijos agentas“, kuris veikia kaip kritiškas mokslinis recenzentas, vertinantis hipotezės kokybę. „Reitingo agentai“ diskutuoja apie tyrimų hipotezes „turnyruose“, naudodami kelis sąveikaujančius didžiuosius kalbos modelius (LLM), kad imituotų diskusiją apie dviejų hipotezių santykinius privalumus.

Kita vertus, “Robin” agentai labiau orientuoti į konkrečias užduotis, susijusias su vaistų pakartotiniu panaudojimu, siekdami nustatyti naujus vaistus tam tikrai ligai. Vienas agentas daugiausia dėmesio skiria eksperimentinių tyrimų pasirinkimui, o kitas analizuoja sudėtingus biomedicininius duomenis.

Kaip atrodo rezultatai?

„Co-Scientist“ gali įvertinti savo sugeneruotų pasiūlymų kokybę naudodama metodą, vadinamą Elo reitingu, kuris geriausiai žinomas kaip šachmatininkų reitingavimo metodas. „Co-Scientist“ savęs vertinimas apie savo rezultatų naujumą ir poveikį gana gerai atitinka žmonių ekspertų pageidavimus ir kitų LLM sistemų vertinimus.

Vaistų paskirties keitimo eksperimente „Co-Scientist“ atrinko 30 vaistų kandidatų kaip perspektyvius gydymo būdus vėžio rūšiai, vadinamai ūmine mieloidine leukemija. Ekspertai (žmonės) onkologai patikslino sąrašą, o penki vaistai buvo išbandyti laboratorijoje. Iš jų trys parodė teigiamus rezultatus, o vienas, regis, buvo ypač perspektyvus.

Kiti eksperimentai parodė „Co-Scientist“ potencialą tirti kelių vaistų derinius.

Pažymėtina, kad „Co-Scientist“ prognozės nebuvo lyginamos su daugybe tikslinių skaičiavimo ir mašininio mokymosi metodų, skirtų vaistų paskirties keitimui, kurie buvo sukurti per dešimtmečius trukusius skaičiavimo biologijos tyrimus. Tai reiškia, kad nežinome, ar naujasis bendrosios paskirties įrankis pranoksta konkretesnius dirbtinio intelekto metodus.

Abi sistemos negali tiesiogiai patvirtinti savo hipotezių, o tai apimtų realius fizinius eksperimentus. Abi taip pat labai remiasi žmogaus indėliu, kad apibrėžtų pagrindinį mokslinį klausimą, patikrintų prognozes ir nustatytų prognozių prioritetus tolesniems tyrimams.

„Co-Scientist“ daugiausia dėmesio skiria hipotezių generavimui naudojant sudėtingus samprotavimo agentus, o patvirtinimą ir interpretavimą palieka vėlesniems etapams. “Robin” taip pat naudoja agentą duomenims, gautiems iš realaus pasaulio eksperimentų, analizuoti.

“Robin” buvo naudojamas siūlant 30 vaistų kandidatų būklei, vadinamai sausa su amžiumi susijusia geltonosios dėmės degeneracija. Penki geriausi buvo atrinkti testavimui.

“Robin” taip pat pateikė pasiūlymus eksperimentams, o žmonės mokslininkai keletą pasiūlymų atmetė. Po kelių minčių šturmo ir analizės etapų du vaistai buvo pripažinti perspektyviais.

Atskirų “Robin” agentų testavimas parodė, kad tie, kurie analizavo ankstesnius tyrimus, užduotį atliko geriau nei bendrosios paskirties LLM. Analitinis agentas prasčiau atsakė į klausimus apie statistiką ir bioinformatiką ir labai rėmėsi žmonių pateiktomis užduotimis.

Vien kalbos ribos

Dirbtinis intelektas gali padėti mokslininkams orientuotis didžiuliame dokumentuotų žinių kiekyje, kurį žmonės sukaupė per tūkstantmečius. Skaičiavimų naudojimas dideliuose duomenų rinkiniuose ieškant dėsningumų, integruojant išsklaidytą informaciją ir siekiant naujų atradimų remiantis esama literatūra jau dešimtmečius prisideda prie mokslo pažangos.

Nauji modeliai, tokie kaip „Robin“ ir „Co-Scientist“, žymi poslinkį link tiesioginio darbo mokslo kalbos, o ne neapdorotų duomenų srityje. Tai leidžia natūralesnį mokslininko ir mašinos bendradarbiavimą per kalba pagrįstas „diskusijas“.

Tačiau natūralesnis nebūtinai reiškia efektyvesnis. Kalba pagrįstas bendravimas gali būti netikslus ir dviprasmiškas, o mokslas turi būti konkretus.

Modeliai, kurie apjungia geriausias šių pasaulių savybes, jau netolimoje ateityje. Jų tikslas – susieti struktūrizuotus kiekybinius duomenis su sąvokomis ir ryšiais, apibūdinančiais pagrindinius faktus.

Tokie modeliai pagrindžia mokslinį samprotavimą žinių struktūroje. Jie leidžia sujungti mokslinius įrodymus – nuo genominių sekų ir baltymų struktūrų iki ląstelių vaizdavimo.

Žodžiai yra tai, kaip perteikiamas mokslas. Dirbtinio intelekto įrankiai, kurie padeda suprasti informaciją, paslėptą visuose šiuose žodžiuose, neabejotinai yra vertingi. Tačiau gamtos pasaulio sudėtingumas reiškia, kad dirbtinio intelekto (bendra)mokslininkai bus tikrai veiksmingi tik tada, kai galės neapsiriboti žodžių jungimu ir modeliuoti visą tų žodžių apibūdinamų sistemų sudėtingumą.

Karin Verspoor, The Conversation

Mokslininkai kuria išmanius sprendimus ūkiams: dirbtinis intelektas padės anksčiau aptikti gyvūnų ligas

Dirbtinis intelektas ir mokymosi kokybė: kodėl mokymuisi reikia laiko net DI amžiuje?

Dirbtinis intelektas moksle: pagalbininkas ar klaidinantis įrankis?

„OpenAI“ skelbia apie didžiausią iki šiol pasiektą dirbtinio intelekto matematikos proveržį

Dirbtinis intelektas parašė mokslinį straipsnį, kuris praėjo recenziją