Tehisintellekt õppis ise end programmeerima: Darwin-Gödeli algoritm

Revolutsiooniline uuring demonstreerib AI-agentide loomist, kes suudavad rekursiivselt oma koodi parandada. Uus Darwin-Gödeli algoritm võimaldab kodeerivatel agentidel end täiustada, saavutades muljetavaldavaid tulemusi automaatses programmeerimises.

G. Ostrov

29. juuni 2025

Teadlased on lõpuks suutnud sulgeda kaua oodatud tsükli, luues AI-agendid, kes suudavad rekursiivselt ennast parandada. Uus uuring esitab muljetavaldava näite sellisest süsteemist, mis põhineb Darwin-Gödeli algoritmil.

Enesetäiustavate süsteemide arengu ajalugu

2003. aastal lõi kuulus teadlane Jürgen Schmidhuber ülesannete lahendajad, kes kirjutasid oma koodi ümber ainult juhul, kui nad suutsid formaalselt tõestada uuenduste kasulikkust. Need süsteemid said nimeks "Gödeli masinad" Kurt Gödeli auks, matemaatiku, kes töötas eneseviitavate süsteemidega. Kuid keerukate agentide puhul oli tõestatav kasulikkus raske saavutada.

Darwin-Gödeli algoritm: uus lähenemisviis

Hiljutises uuringus kirjeldatud uued süsteemid tuginevad empiirilistele tõenditele. Schmidhuberile austust avaldades nimetatakse neid Darwin-Gödeli masinateks (DGM). DGM algab kodeeriva agendiga, kes oskab koodi lugeda, kirjutada ja käivitada, kasutades suuri keelemudeleid (LLM) lugemiseks ja kirjutamiseks.

Seejärel rakendab süsteem evolutsioonilist algoritmi paljude uute agentide loomiseks. Igal iteratsioonil valib DGM populatsioonist ühe agendi ja annab LLM-ile ülesande luua üks muudatus agendi kodeerimisvõime parandamiseks. LLM-idel on intuitsioon selle kohta, mis võiks aidata, kuna nad on treenitud suure hulga inimeste kirjutatud koodi peal.

Süsteemi ainulaadsed omadused

Erinevalt traditsioonilistest evolutsioonilistest algoritmidest, mis säilitavad ainult parimad sooritajad, säilitavad DGM-id kõik agendid. Seda tehakse juhuks, kui innovatsioon, mis algselt ebaõnnestus, muutub hiljem läbimurde võtmeks pärast edasist arendamist. See on "avatud uurimise" vorm, mis ei sulge edenemise teid.

Muljetavaldavad testimistulemused

Teadlased käivitasid DGM-i 80 iteratsiooni jooksul, kasutades SWE-bench ja Polyglot etalonkoodide. Tulemused ületasid kõiki ootusi:

SWE-bench puhul paranesid agentide skoorid 20%-lt 50%-ni
Polyglot puhul 14%-lt 31%-ni

"Olime tõesti väga üllatunud, et agent suutis ise nii keerulist koodi kirjutada," ütles Jenny Zhang, Briti Columbia Ülikooli uuringu peamine autor. "Ta suutis redigeerida mitut faili, luua uusi faile ja luua tõeliselt keerukaid süsteeme."

Turvalisus ja piirangud

Mõistes võimalikke riske, lisasid uurijad vajalikud kaitsemeetmed. DGM-id hoiti isoleeritud keskkonnas ilma interneti või operatsioonisüsteemi juurdepääsuta, kõik koodimuudatused registreeriti ja kontrolliti. Tulevikus plaanitakse jätkata uuringuid, premeerides agente tõlgendatavuse ja kooskõla suurendamise eest.

Kuigi parim SWE-bench agent ei saavutanud veel parimate inimestest arendajate taset (umbes 70%), loodi see täiesti automaatselt. Piisava aja ja arvutusressurssidega võivad sellised agendid ületada inimeste ekspertteadmised programmeerimises.

Probleemide korral kirjutage meile, aitame kiiresti ja kvaliteetselt!