Pensilvanijos universiteto inžinieriai sukūrė naują būdą, kaip panaudoti dirbtinį intelektą atvirkštinėms dalinėms diferencialinei lygtims (DDL) spręsti – tai ypač sudėtinga matematinių problemų klasė, turinti didelę reikšmę gamtos pasaulio supratimui.

Vyresnysis autorius Vivek Shenoy (kairėje) ir bendraautoris Vinayak Vinayak (dešinėje). Nuotrauka: Sylvia Zhang
Ši pažanga, kurią tyrėjai vadina „minkštinančiaisiais sluoksniais“ (Mollifier Layers), galėtų būti naudinga tokiose įvairiose srityse kaip genetika ir orų prognozavimas, nes atvirkštinės DDL padeda mokslininkams žvelgti atgal nuo stebimų modelių ir nustatyti paslėptą dinamiką, kuri juos sukūrė.
„Atvirkštinės problemos sprendimas yra tarsi žiūrėti į raibulius tvenkinyje ir dirbti atgaline tvarka, kad išsiaiškintumėte, kur nukrito akmenukas“, – sako Vivekas Shenoy, Eduardo D. Glandto prezidento išskirtinis medžiagų mokslo ir inžinerijos profesorius (Materials Science and Engineering, MSE )ir vyresnysis tyrimo, paskelbto žurnale „Transactions on Machine Learning Research“ (TMLR), kuris bus pristatytas Neuroninės informacijos apdorojimo sistemų konferencijoje (NeurIPS 2026), autorius.
„Galima aiškiai matyti pasekmes, tačiau tikrasis iššūkis yra nustatyti paslėptą priežastį.“
Užuot tiesiog panaudoję daugiau skaičiavimo galios problemai spręsti, tyrėjai ieškojo geresnio matematinio požiūrio. „Šiuolaikinis dirbtinis intelektas dažnai tobulėja didindamas skaičiavimo apimtį“, – sako Vinayakas Vinayakas, MSE doktorantas ir tyrimo bendraautoris. „Tačiau kai kuriems moksliniams iššūkiams reikia geresnės matematikos, o ne tik daugiau skaičiavimo.“

Doktorantas Vinayakas Vinayakas. Nuotrauka: Sylvia Zhang, „Penn Engineering“
Kodėl svarbios atvirkštinės DDL?
Iš esmės diferencialinės lygtys yra matematiniai įrankiai pokyčiams apibūdinti. Jos padeda mokslininkams modeliuoti, kaip sistemos evoliucionuoja, pavyzdžiui, kaip auga populiacija, kaip išsisklaido šiluma arba kaip laikui bėgant vyksta cheminė reakcija.
Dalinės diferencialinės lygtys nagrinėja sudėtingesnes sistemas, aprašydamos, kaip viskas keičiasi tiek erdvėje, tiek laike. Jos naudojamos modeliuojant tokius įvairius reiškinius kaip oro sistemos, šilumos tekėjimas per medžiagą ir, Shenoy laboratorijos atveju, DNR organizacija ląstelių viduje.
Atvirkštinės dalinės diferencialinės lygtys užduoda dar sunkesnį klausimą: užuot naudojusios žinomas taisykles, kad numatytų, kaip sistema elgsis, jos padeda mokslininkams dirbti atgaline data, remiantis tuo, ką jie gali stebėti, ir daryti išvadą apie paslėptas jėgas, parametrus ar dinamiką, kuri ją sukūrė.
„Jau daugelį metų naudojame šias lygtis, kad ištirtume, kaip chromatinas, kuris yra sulankstyta DNR būsena branduolio viduje, organizuojasi gyvų ląstelių viduje“, – sako Shenoy. „Tačiau mes vis susidurdavome su ta pačia problema: galėjome matyti struktūras ir modeliuoti jų formavimąsi, bet negalėjome patikimai nustatyti epigenetinių procesų, kurie valdo šią sistemą, būtent cheminių pokyčių, kurie padeda kontroliuoti, kurie genai yra aktyvūs. Kuo labiau bandėme optimizuoti esamą metodą, tuo aiškiau tapo, kad reikia keisti pačią matematiką.“

Chromatino vaizdavimo rezultatas, kurio išsiskleidimą dabar galima tiksliau apibūdinti naudojant minkštinimo sluoksnius, turi įtakos senėjimo, sveikatos ir ligų supratimui. Nuotrauka: Sylvia Zhang, Penn Engineering
Permąstant, kaip DI atlieka matematikos veiksmus
Problemos centre yra apgaulingai paprasta matematinė idėja: diferenciacija arba matavimas, kaip kažkas keičiasi. Išvestinė gali pasakyti mokslininkams, kaip greitai dydis didėja arba mažėja. Aukštesnės eilės išvestinės eina toliau, padėdamos apibūdinti sudėtingesnius pokyčių modelius.
Daugelį metų DI sistemos, spręsdamos atvirkštines dalines diferencialines lygtis, šias išvestines paprastai apskaičiuodavo metodu, vadinamu rekursiniu automatiniu diferenciavimu, kuris pakartotinai apskaičiuoja, kaip keičiasi kiekiai, per neuroninį tinklą, visų DI modelių pagrindą.
Tačiau aukštesnės eilės sistemose, ypač kai duomenyse yra triukšmingų duomenų, šis procesas gali tapti nestabilus ir pareikalauti didžiulių skaičiavimo galių.
Kaip apibūdina tyrėjai, rekursinis automatinis diferencijavimas yra tarsi pakartotinis linijos nuolydžio priartinimas: jei linija yra nelygi, kiekvienas papildomas žingsnis gali padidinti duomenų triukšmą ir sumažinti galutinio rezultato patikimumą. Kitaip tariant, komanda suprato, kad jiems reikia būdo patikimai išlyginti signalą prieš matuojant pokyčius.
1940-aisiais Kurtas Otto Friedrichsas, vokiečių-amerikiečių matematikas, vėliau gavęs Nacionalinį mokslo medalį, aprašė „švelnintuvus“ – matematinius įrankius, kurie „švelnina“ ypač triukšmingas ar nelygias funkcijas, išlygindami jų ryškiausias ypatybes.
Pritaikydama šią techniką, komanda sugebėjo išvengti rekursinio automatinio diferencijavimo keliamų problemų. „Iš pradžių manėme, kad problema susijusi su neuroninio tinklo architektūra“, – sako Ananyae Kumar Bhartari, Penn Engineering mokslinės kompiuterijos magistro programos absolventė ir kita straipsnio bendraautorė. „Tačiau kruopščiai pakoregavę tinklą, galiausiai supratome, kad kliūtis buvo pati rekursinė automatinė diferenciacija.“
Įdiegus „švelninimo sluoksnį“, kuris išlygino signalą prieš jį išmatuojant, radikaliai sumažėjo ir triukšmas, ir energijos suvartojimas. „Tai leido mums patikimiau išspręsti šias lygtis, be tos pačios skaičiavimo naštos“, – sako Bhartari.
Chromatino analizė
Shenoy laboratorijai vienas iš neatidėliotinų švelninimo sluoksnių pritaikymų yra geresnis supratimas, kaip mažyčiai chromatino domenai, arba baltymų ir DNR mišinys, kuris pakuoja chromosomas saugojimui ląstelių viduje, reguliuoja prieigą prie genetinės medžiagos branduolyje, remiantis ankstesniais darbais, rodančiais, kaip epigenetinės reakcijos ir fizinė sąveika organizuoja chromatino struktūrą.
„Šie domenai yra vos 100 nanometrų dydžio“, – sako Shenoy, „tačiau kadangi prieinamumas lemia genų raišką, o genų raiška valdo ląstelių tapatybę, funkciją, senėjimą ir ligas, šie domenai atlieka svarbų vaidmenį biologijoje ir sveikatai.“
Nustatydami epigenetinių reakcijų greitį, kuris lemia šiuos pokyčius, kitaip tariant, kaip greitai įvyksta šie genus reguliuojantys cheminiai pokyčiai, minkštinamieji sluoksniai galėtų padėti chromatiną tyrinėjantiems tyrėjams pereiti nuo paprasto jo struktūros stebėjimo naudojant galingus mikroskopus prie modeliavimo, kaip jis keičiasi laikui bėgant ir kaip tie pokyčiai veikia genų raišką.
„Jei galime sekti, kaip šie reakcijų greičiai vystosi senėjimo, vėžio ar vystymosi metu“, – priduria Vinayakas, – „tai sukuria naujų gydymo būdų potencialą: jei reakcijos greičiai kontroliuoja chromatino organizaciją ir ląstelių likimą, tuomet šių greičių keitimas galėtų nukreipti ląsteles į norimas būsenas.“
Būsimos kryptys
Minkštinantieji sluoksniai taip pat galėtų būti naudingi ne tik biologijos srityje. Kadangi daugelis medžiagų mokslo, skysčių mechanikos ir kitų mokslinio mašininio mokymosi sričių problemų apima aukštesnės eilės diferencines lygtis ir triukšmingus duomenis, ši sistema galėtų pasiūlyti stabilesnį ir skaičiavimo požiūriu efektyvesnį būdą nustatyti paslėptus parametrus įvairiose sistemose.
Tyrėjai tikisi, kad tas pats matematinis metodas, kuris padėjo atskleisti paslėptus reakcijos greičius chromatine, galėtų padėti mokslininkams spręsti panašiai sudėtingas atvirkštines problemas daugelyje kitų sričių. „Galiausiai tikslas yra pereiti nuo sudėtingų modelių stebėjimo prie kiekybinio juos generuojančių taisyklių atskleidimo“, – sako Shenoy. „Jei suprantate taisykles, kurios valdo sistemą, turite galimybę ją pakeisti.“
Mollifier Layers: Enabling Efficient High-Order Derivatives in Inverse PDE Learning, Mollifier Layers: Enabling Efficient High-Order Derivatives in Inverse PDE Learning, openreview.net/forum?id=6mFVZS … ing=2&sort=date-desc
Didžiausias pasaulyje olimpiados lygio matematikos uždavinių rinkinys dabar prieinamas visiems
Nerimas prieš egzaminą nėra nuosprendis: kaip išmokti matematiką be panikos?
„ChatGPT“ gali pateikti originalius matematinius įrodymus, parodė tyrėjai
KTU kartu su dviem pasaulinio lygio universitetais pradeda matematikos doktorantūros studijas
