Pirmą kartą „ChatGPT“ išsprendė neįrodytą geometrijos uždavinį

Naujas tyrimas rodo, kad DI gali padėti generuoti naujus matematinius įrodymus, o tai rodo teorinių tyrimų atlikimo būdo pokytį.

Naujas tyrimas parodė, kad „ChatGPT-5.2“ gali generuoti originalius matematinius įrodymus, o tai įdiegia „įrodymą vibracija“ kaip naują DI samprotavimo metodą. DI paspartina atradimus, tačiau žmogaus patvirtinimas išlieka būtinas.

dirbtinis intelektas3

Dirbtinis intelektas (DI) – robotas „Android“ – sprendžia matematines lygtis

VUB (Free University of Brussels) duomenų analizės laboratorijos tyrėjai praneša, kad komerciniai kalbos modeliai gali generuoti originalius matematinius įrodymus. Savo tyrime komanda parodė, kad didelis „OpenAI“ kalbos modelis „ChatGPT-5.2“ (Thinking) sugebėjo pats išspręsti matematinę problemą.

Tyrime daugiausia dėmesio skirta matematikų Rano ir Tengo pasiūlytos 2024 m. hipotezės įrodymui. Hipotezė yra teiginys, kuris, remiantis modeliais arba pasikartojančiais rezultatais, laikomas teisingu, tačiau dar nėra oficialiai įrodytas. Kai nustatomas galiojantis įrodymas, hipotezė tampa teorema.

Tyrimo duomenimis, galutinis įrodymas buvo gautas po septynių pokalbių sesijų su „ChatGPT“ ir keturių besivystančių argumentų versijų. Modelis atliko pagrindinį vaidmenį tyrinėjant galimus metodus, o žmonės tyrėjai užtikrino, kad samprotavimai būtų teisingi ir logiškai išsamūs.

„ChatGPT“ vaidmuo matematiniuose atradimuose

Tyrėjai nustatė, kad „ChatGPT-5.2“ (Thinking) sukūrė didžiąją dalį įrodymo struktūros su ribotu žmogaus indėliu. Kaip jie pažymi: „Su Duomenų analizės laboratorija esame vieni pirmųjų, kurie pademonstravo, kad komerciškai prieinamas LLM gali savarankiškai kurti originalius matematinius įrodymus.“

„Jau seniai įtariau, kad „ChatGPT“ gali padėti įrodyti neišspręstas matematines problemas“, – sako Brechtas Verbekenas (VUB Duomenų analizės laboratorijos tyrimų grupės podoktorantūros tyrėjas). „Ir vis dėlto buvau nustebintas, kaip efektyviai tai pavyko.“

Komanda šį darbą priskiria platesniam požiūriui, kurį jie vadina vibraciniu įrodymu, kur kalbos modeliai padeda organizuoti ir tyrinėti sudėtingas teorines idėjas. Jie taip pat kelia klausimą, ar šis metodas galėtų tobulėti taip greitai, kaip dirbtinio intelekto padedamas programavimas, žinomas kaip vibracinis kodavimas, kuris jau išsivystė nuo paprastų įrankių iki beveik autonominio kodo generavimo. „Dažnai girdime, kaip žmonės mano, kad sistemų kūrybiškumas iš esmės apsiriboja jų mokymo duomenų performulavimu“, – sako VUB profesorius Vincentas Ginis (Duomenų analizės laboratorija). „Džiaugiuosi, kad savo darbu galime išsklaidyti ir šią klaidingą nuomonę.“

Žmogaus patikrinimas ir dirbtinio intelekto tyrimų ateitis

Nepaisant didelio modelio indėlio, tyrėjai pabrėžia, kad žmogaus dalyvavimas išlieka būtinas galutiniam patikrinimui ir likusių įrodymo spragų pašalinimui. Tyrimo procesas taip pat pabrėžia, kur kalbos modeliai yra naudingiausi ir kur vis dar kyla iššūkių patvirtinant rezultatus.

Šis darbas yra reikšmingas dirbtinio intelekto žingsnis teoriniuose tyrimuose. Be to, kad palaiko kodavimo ar rašymo užduotis, kalbos modeliai dabar gali prisidėti prie originalių matematinių atradimų, kai juos derina kruopšti žmogaus priežiūra. „Įrodymų formulavimas dabar gali būti daug greitesnis, tačiau kliūtimi tampa žmogaus atliekamas patikrinimas. Tam reikia laiko. Tačiau kalbos modeliai mums ir čia padės“, – daro išvadą VUB profesorius Andresas Algaba (VUB duomenų analizės laboratorija).

“Early Evidence of Vibe-Proving with Consumer LLMs: A Case Study on Spectral Region Characterization with ChatGPT-5.2 (Thinking)” by Brecht Verbeken, Brando Vagenende, Marie-Anne Guerry, Andres Algaba and Vincent Ginis, 21 February 2026, arXiv.
DOI:10.48550/arXiv.2602.18918.

Dirbtinis intelektas parašė mokslinį straipsnį, kuris praėjo recenziją

Investicijų strategas: dirbtinis intelektas keičia finansų rinkas, bet didina ir rizikas

Telefoniniai sukčiai prakalbo lietuviškai: dirbtinis intelektas apgauna net ir pačius budriausius