OpenAI esitles uut murdelist keelemudelit GPT4
Ettevõte OpenAI tutvustas uut murdelist tehisintellekti GPT4, mis on oma väärtussüsteeme lõhkuma asunud eelkäijast veelgi loomingulisem ja faktitäpsem. Paraku paistab taas, et sellega inimestele tekitatav lisastress jääb entusiasmilaine varju, leiab R2 tehnikakommentaaris Kristjan Port.
Eelmisel nädalal kordus mõnes ringkonnas jõulude-eelne meeleolu. Teate ju küll, selline magus ootus, kui unistatakse ja oletatakse, mis kingipakis paeidus on. Tegu on igal juhul mõnusa ajaga, kuivõrd mingi kingitus on kindlasti tagatud. Seekordsed ootused olid seotud uue tehisintellekti mudeliga.
Uudisvood, erialaringkondades toimuv arendustegevus ja võidu avalikustatud teenused elasid veel ChatGPT põhjustatud elevuses, kui levisid kuuldused, et nädala pärast peaks avalikkusele tutvustatama kõige uuemat sisu loova tehisintellekti GPT mudelit, versiooninumbriga 4. Veel hiljuti ennustasid mõned asjasse pühendunud eksperdid, et selle suure ressursi nõudlikkuse tõttu võib hakata sellest rääkima alles paari aasta pärast.
Kuulujuttude põhjustatud erutus oli nüüd nii äge, et kohe otsa levisid kuuldused aasta lõpuks viienda versiooni saabumisest. See pole võimatu, mõeldes esmalt nädala eest toimunud Tesla roboti demonstratsioonile, milles robot tegeles teise roboti välistamisega. Ilmselt osaleb viienda GPT mudeli ettevalmistustöödes selle varasem mudel või mõni muu AI sugulane.
Igal juhul on teisipäevast GPT-4 kohal. Mudeli toimekusest saab teada pärast selle proovimist kõiksugu ülesannete kontekstides. Võimekuse üle spekuleerimiseks võib mõelda mudeli loomiseks kaasatud masinõppe parameetrite arvule. See jääb oma tähenduses enamikule ilmselt kaugeks, number ise on arusaadavam ning aitab tajuda ülesande haaret ja tööks vajaliku arvuti võimsust.
Ühtlasi aitab see mõista, miks võib näha antud valdkonnas ikka ja jälle vaid käputäit samu ettevõtteid. Suure parameetrite hulga kaasamine eeldab väga suurt ja kallist arvutiparki. Microsoft ostis osaluse OpenAI-s kümne miljardi dollari eest ja on ChatGPT arendamiseks vajalikku arvuti loomisele kulutanud sadu miljoneid dollareid.
Võib-olla tekitavad segadust värsked uudised Meta arendatud OpenAI GPT-ga konkureeriva suure keelemudeli LLaMA (Large Language Model Meta AI) seadistamisest sülearvutisse ja isegi nutitelefoni. Tegemist on valmis rakendusega, mille Meta tegi avalikuks, jättes mudelite tööks vajalikud statistilised kaalud enda teada. Nende loomine nõuabki lisaks ainulaadsetele algoritmidele väga suurt ja tavatult kallist arvutiparki.
Juhtum vääriks eraldi kommentaari, sest võib osutuda revolutsiooniliseks. Reedel lekkisid saladuslikud kaalud infosfääri ja nüüd oodatakse ärevusega, kas igaüks võib hakata võimsa tehisintellekti omanikuks. LLaMA kasutab 65 miljardit masinõppe parameetrit. Selliseks tööks ei piisa isegi päris võimekast arvutist ja esimestes katsetes töötab arvutisse paigaldatud mudel seitsme miljardi parameetriga. Alanud testi tulemusi peab veel ootama.
GPT-3 õpetamisel kasutati umbes 175 miljardit parameetrit. Mudeli tulemustest on meedias palju imetlevaid ja tunnustavaid tähelepanekuid. Leidub ka kriitikat. See toobki neljanda versiooni juurde. GPT-4 koolitamisesse kaasati umbes 100 triljonit parameetrit. Kvantitatiivne arenguhüpe on seega suurusjärkude võrra suurem. Intellektuaalne areng pole lineaarne ega kiirene suurusjärkude võrra. Ometi lubavad arendajad märgatavat kvaliteedi hüpet.
Varasemalt käis uudisvoost läbi teade USA advokatuuri eksami edukalt sooritanud ChatGPT-st. Inimkeeli suhtleva teenuse taustal töötas mõnesaja miljardi parameetriga GPT mudel 3.5. Edu oli reaalne. Lähemal vaatusel vastas aga tulemus tinglikult kolmesele õpilasele. Uue, neljanda versiooni puhul ennustavad arendajad, et mudel läbib sama eksami suurepärasele hindele, asudes paremiku ülemises kümnendikus. Ilmselt on seda arendajad juba testinud.
Samuti väidetakse, et kui eelmine versioon saanuks bioloogia olümpiaadil koha madalama 31 protsendi hulgas, siis uus versioon oleks parima ühe protsendi sees. Seda ilmsemalt testitakse uut versiooni igasuguste eksamite ja probleemide lahendamistes.
Sellega on ka arvestatud. Uus mudel pidavat oluliselt paremini mõistma keeruliste ülesannete sõnastust ja on suuteline neile ka vastama. Näiteid leiab GPT-4 tutvustavalt veebilehelt. Uue mudeli puhul lubatakse senisest paremat suhtluse sujuvust ja turvalisust. Varasemast on teada, et masinaga suhtlemine äratab inimestes nurjatu pale ja nad esitavad sellele ebamoraalseid väljakutseid. Seetõttu seati süsteemile teatud teemapiirangud.
Kurja geeniuse leidlikkus ületab ontlikest inimestest piirangute seadjate nutikust ja eelmist versiooni võidi sundida halvale teele. Kuna GPT-4 mõistab endisest paremini ka keerukate ülesannete sisu, lubavad arendajad, et see peaks oskama enamusest taolistest olukordadest viisakalt väljuda.
Juurdepääs uuele mudelile on esialgu veel valikuline. Seda saavad lähemalt proovida maksvad kliendid, mõned organisatsioonid ja teenuste arendajad. Ülejäänud huvilised võivad sattuda proovima piiratud funktsionaalsusega teenust või tuleb end registreerida ootenimekirja. Ilmselt ei pea siiski kaua ootama.
Samuti on oodata varasemast pöörasemate kogemuste tõttu veelgi suuremat meediakajastust. Nagu öeldud, olukord meenutab vähemalt mõnedele inimestele jõulude-eelset ootusärevat aega. Paraku jäetakse sellelt pildilt välja niinimetatud täiskasvanud ehk need, kelle jaoks on jõulud kõrge stressi allikas.
ChatGPT põhjustas ärevust haridussüsteemis ja paljudes loomevaldkondades, kuna tegi ära inimeste töid ja ülesandeid. Nüüd paigaldatakse sellesse veelgi võimekam mootor. Vaese aja lohutusena ei tule vähemalt stressist puudust.
Esmaspäevast neljapäevani võib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2 saates "Portaal".
Toimetaja: Jaan-Juhan Oidermaa
Allikas: "Portaal"