Deepmind esitles uudseid lahenduskäike loovat tehisaru

Google'i all tegutseva ettevõtte Deepmind insenerid esitlesid uudset suuri keelemudeleid kasutavat süsteemi, mis suudab mudelite pakutavaid lahendusi täiustada. Näitkatsetes suutis see kiirendada muu hulgas arvutikiipide tööd, muuta tõhusamaks Google'i andmekeskuseid ja lahendada uudsel viisil matemaatikaprobleeme.
Seni on tehisintellekti vallas ilma teinud peamiselt kahte tüüpi süsteemid. Neist esimesed on saavutanud oma kitsas valdkonnas ennekuulmatuid tulemusi, näiteks ennustanud peaaegu kõigi teadusele teadaolevate valkude kuju. Samas tuleb nende treenimiseks palju vaeva näha ja neid ei saa kasutada pea millekski muuks.
Suured keelemudelid suudavad seevastu lahendada mitmesuguseid ülesandeid ja genereerida hulga hüpoteese. Tõenäosusliku olemuse tõttu on neil kalduvus hallutsineerida ehk esitada eksitavat infot. Nõnda võib olla ka nende kirjutatud kood ebaühtlase kvaliteediga.
Deepmindi insenerid lootsid luua mitmekülgsema tööriista. Lisaks keerukatele teaduslikele ja matemaatilistele probleemidele lahenduse pakkumisele nägid nad seda avastamas ka täiesti uusi algoritme. Selleks ühendasid nad mitu uuenduslikku tehnikat.
Esiteks suutsid selle selgrooks olevad evolutsioonilised algoritmid lisaks üksikute funktsioonide ja koodiridade täiustamisele töötada ka tervete koodifailide ning keerukate, mitmetest funktsioonidest koosnevate algoritmidega. Piltlikult oli see võimeline täiustama korraga tervet programmi ökosüsteemi.
Samal ajal pakkus AlphaEvolve aga süsteemi aluseks olevatele tipptasemel keelemudelitele eelnevate katsete kohta üksikasjalikku tagasisidet ja konteksti. Viimane aitas neil omakorda pakkuda paremaid lahendusi. Viimaks suutis AlphaEvolve tegutseda korraga mitme eri eesmärgi saavutamise nimel, mitte ei parandanud vaid ühte mõõdikut.
Näitkatsetes kasutas töörühm AlphaEvolve'i nii Google'i enda süsteemide töö tõhustamiseks kui ka matemaatika ja informaatika vallas uute algoritmide avastamiseks. Näiteks töötas see välja tõhusama planeerimisalgoritmi Google'i Borg andmekeskuste jaoks. Uuendus võimaldas säästa 0,7 protsenti Google'i üleilmsest arvutusvõimsusest, mis muidu oleks kasutult seisnud. Samuti leidis see viisi AlphaEvolve'i enda aluseks oleva tehisaru treenimisprotsessi kiirendamiseks.
Matemaatika vallas avastas see muu hulgas uue meetodi kahe 4×4 kompleksarvulise maatriksi korrutamiseks, kasutades vaid 48 skalaarkorrutamist. Tegu oli selles vallas esimese edasiminekuga pärast 56 aastat, parandades matemaatiku Volker Strasseni algoritmi ühe skalaarkorrutise võrra. Leiust on kasu näiteks närvivõrkude treenimisel. Enam kui 50 uuritud avatud matemaatilisest probleemist suutis AlphaEvolve leida parima teadaoleva lahenduse ligi 75 protsendil juhtudest. Pea igal viiendal juhul avastas see uusi, senistest paremaid ja tõestatult õigeid lahendusi.
Nii kujutab AlphaEvolve võrreldes eelnevate tehisarumudelitega üldotstarbelisemat tööriista, mis suudab avastada inimestele tundmatuid lahendusi ja pidevalt oma varasematest katsetest õppida. Laiast ehk üldotstarbelist tehisarust on see Deepmindi teadlaste hinnangul aga veel kaugel. Hakatuseks sõltub see automaatsetest hindamismehhanismidest. See välistab valdkonnad, kus on vaja subjektiivset inimhinnangut või vaja teha füüsilisi katseid.
Samuti peab inimene määratlema ülesande, hindamiskriteeriumid ja sageli esialgse lahenduse ehk ütlema, mille suunas programm töötama peaks. Viimaks puudub AlphaEvolve'il laiem maailmatunnetus ning ei suuda algoritmilise avastuse ja optimeerimisülesannete lahendamise kõrval kirjutada näiteks romaani või kavandada iseseisvalt füüsikakatseid.
Sellegipoolest ilmestab loodud süsteem töörühma hinnangul, et tehisarust pole enam kasu vaid ülesannete automatiseerimisel, vaid see suudab ka ise avastusi teha. Võimekus optimeerida keerukaid algoritme võiks kiirendada edasist innovatsiooni.
AlphaEvolve'i kirjeldav töö ilmus Deepmindi kodulehel. Suure ressursikasutuse tõttu pole aga ettevõte tööriista ennast veel avalikult kättesaadavaks teinud.
Toimetaja: Jaan-Juhan Oidermaa