OpenAI uus tehisaru pani matemaatikud ahhetama
OpenAI uus tehisaru mudel o3 saavutas enneolematult häid tulemusi vähemalt kolmes abstraktset üldistusvõimet nõudvas ja kuldstandardiks peetavas testis. Isegi kui selle käitamine nõuab tuhandeid dollareid, võib ekspertidel olla põhjust oma töökoha pärast muretseda, nendib R2 tehnikakommentaaris Kristjan Port.
Apple Intelligence on Apple'i arendatav tehisintellekti süsteem, mis jõudis avalikkuse ette möödunud suvel. Praeguseks on see saadaval mõnedes uuemates telefonides ning tahvel- ja sülearvutites, seda muidugi juhul, kui need ei asu Euroopa Liidus. Nukrutsemiseks pole siiski põhjust, kuivõrd AI lühendi taha peituva teenuse kasutajad pole sellest eriti vaimustuses. Tagasihoidliku kasulikkuse kõrval kipub Apple'i intellekt pealegi fantaseerima.
Selle viimase tõendina väitis AI, et noolemängija Luke Littler võitis professionaalsete noolemängijate maailmameistrivõistlused enne, kui ta polnud isegi veel finaali jõudnud. Seekord oli vale sõnum aga õige – 17-aastane Luke Litter tuli noorima mängijana noolemängu maailmameistriks.
Vahest läheb minulgi õnneks, muidugi mitte noolemängijana, vaid ennustajana. Väitsin hiljuti, et soovijad saavad OpenAI šokeerivalt võimast TI mudelit kasutada 200 dollari eest. Olgu täpsustatud, et see pole veel võimalik. Mudeli miniversioon lubatakse teha avalikkusele kättesaadavaks sel kuul. Selle suurema ja võimsama venna kasutamisvõimalusi jagatakse hetkel vaid vähestele erialaekspertidele.
Sellega seoses võiks proovida õnne ja spekuleerida ekspertsuse teemal. Paljudele on tuttav masinintellekti tuvastamiseks kasutatav Turingi test. Selle käigus püüab inimene ära arvata, kas temaga suhtleb liigikaaslane või arvuti. Kui ta vahet ei tee, pakkus modernse arvutiajastu üks rajaja, Alan Turing, et masin on intelligentne. Test pole kõige kohasem, sest selle käigus on peetud ka inimesi ebaintelligentseteks arvutiteks.
Kordades tõsisem on ARC-AGI test ehk väikestest puslelaadsetest ülesannetest koosnev abstraktsiooni ja arutluskorpus. Sellega testitakse TI-agendi võimet sarnaselt inimesele mõista ja üldistada ülesandeid minimaalsete vihjete põhjal. Erinevalt teistest TI arengutaset hindavatest testidest välistab ARC tulemuse parandamise abil eelkoolituste või toore arvutusvõimuse. Ülesanded eeldavad minimaalsete kontseptuaalsete juhiste põhjal, nagu kujundite liikumise, värvimuutuste või mustrite täiendamise võimet aimata ja üldistada. See kõik tähendab, et lahendusi tuleb alles leiutada.
Kui TI suudab lahendada ARC mõistatusi järjepidevalt, viitab see tugevale kontseptuaalsele mõtlemisvõimele. See eristab seda nn kitsastest, spetsialiseerunud TI-süsteemidest ja viitab laiale, kohanduvale intellektile, mis on võrreldav ja sarnane inimese omaga. Samas ei pea olema see inimese intellektiga täpselt sama. Me ei tea, kas inimese intellekt on parim, mis võimalik. Tärkava intellekti inimpõhistesse mõõdikutesse surumine võib olla eksitav.
OpenAI o3 kogus ARC-AGI testis muljetavaldavad 87,5 punkti, võrreldes eelmise o1 mudeli 32 punktiga.
Väidetavalt olid mitmed matemaatikud šokis kuuldes, et o3 saavutas üliraskete FrontierMath matemaatikatestis tulemuseks 25,2 punkti, kui varasem parim tulemus jäi alla kahe punkti. Matemaatikute loodud testi saladuses hoitavaid ülesanded pole keegi varem näinud. Nende lahendamine ei põhine varasemal masinõppel, vaid jooksval abstraktsel arutelul, kaustades mitmeid erinevaid lahendusstrateegiaid. Kolmandaks saavutas o3 rekordilise tulemuse tarkvarainseneride loodud väga nõudlikus Bench Verified testis.
Väidetavalt kasutab o3 kompleksse ülesandega päringule vastamiseks umbes 1000–3000 dollari vääringus energiat. Kuna energiahinnad võivad erineda, pakutakse, et energiakulu on umbes 1785 kWh. Kui TI-le antakse ülesanne, mida suudavad täita vaid vähesed, tähendab see, et need vähesed spetsialistid on kõrgelt haritud või kõrgelt kvalifitseeritud ning neil on kõrged palgad. Kui o3 lahendab sama ülesande neist kiiremini ja küsib selle eest 1000 dollarit, tekib sellegipoolest märgatav surve ekspertide koondamiseks.
See muutub veelgi pakilisemaks, kui TI lahendab järjestikku mitmeid ülesandeid, eriti kui inimeste puhul kuluks ülesannete lahendamisel aega ka näiteks projekti käivitamiseks. Andes o3 tasemega või võimsamale süsteemile mitu pikaajalist või korduvat ülesannet, võib see aja jooksul välja tõrjuda märgatava osa spetsialiseeritud tööjõust. Seejuures võib masina teenus maksta rohkem.
Võimalik, et kuskil tekib ootamatu pudelikael ja sünnib huvitavaid ohuolukordi. Kitsaskohaks võib kujuneda masina võimete tasemele ja kasutamise hinnale piisavalt keeruliste ülesannete andmine. Tegutsedes inimestest kiiremini, võib juhtuda, et inimestel pole anda masinale piisavalt otstarbekaid ülesandeid. Otstarbekus on oluline, sest inimene teab, mis on talle vajalik ja kasulik.
Juhul kui TI-l endal palutakse avastada uusi lahendamist vajavaid väljakutseid, võib juhtuda, et inimesed ei mõista, mida tulemustega peale hakata, kuna nad ei tea, mida ja milleks lahendati ega sedagi, kas tulemus on õige. Lahenduste õigsuse kinnitamine võib olla aeganõudev ja vajab harvaesinevaid teadmisi. Nii võib ülesannete kiire lahendamise tsükkel katkeda. Pole välistatud, et TI tegeleb tulutute töödega ja raiskab vaid energiat või loob midagi ohtlikku, mis pole inimestele arusaadav ega nende kontrolli all.
Veelgi huvitavama tagajärjena võib aga iseseisvalt head tööd tegev TI lühikese ajaga avastada, leiutada või luua nii palju murrangulisi hüvesid, et ühiskond ei suuda nendega kohaneda. Liigne hea muutub seega mürgiks. Vahest aitab o3 või millegi veelgi võimekama ootus keskenduda ettevalmistumisele.
Esmaspäevast neljapäevani võib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2 saates "Portaal".
Toimetaja: Jaan-Juhan Oidermaa
Allikas: "Portaal"