Eksperdid: andmenappus ei pidurda tehisaru arengut veel niipea

Ajakirjanduse vahendusel on sel aastal üha sagedamini kõlama jäänud, et ChatGPT ja teiste suurte keelemudelite treenimise jaoks ei jätku varsti maailmas enam piisavalt uusi kvaliteetseid andmeid. Eesti eksperdid leiavad, et andmepuudus probleemiks siiski ei saa ja neid hakatakse ammutama lihtsalt uutest allikatest.
Arvutiteadlane ja tehisintellekti ekspert Kristjan Korjus tõdes, et praeguste lahenduste ning lähenemisviisidega võib suurte keelemudelite areng tõepoolest mõnevõrra aeglustuda. Seisma see siiski ei jää. Silmapiiril terendavad juba täiesti uued meetodid, mis võivad arengut hoopis märkimisväärselt kiirendada.
"Kui me täpselt samamoodi jätkame, ei lähe suured keelemudelid tõepoolest enam nii kiiresti paremaks. Mingisuguseid väiksemaid nippe leitakse täiendusteks ikka. Niisamuti ei saa uued andmed kunagi täiesti otsa. Kahe aasta pärast on keelemudelid ikkagi paremad, kui nad praegu on," tõi ta välja.
Korjuse sõnul hakkavad eksperdid siiski taipama, et keelemudelite areng ei pruugi olla logaritmiline. "Me teame, et paari aasta pärast on protsessorid palju kiiremad kui praegu. Suurte keelemudelite puhul ei olda selles enam nii kindlad. See on siiski veel vaid hüpotees. Me ei saa seda veendunult väita, aga tõesti on märke, et suurte keelemudelite targemaks saamise kiirus on praeguste arhitektuuridega aeglustumas," märkis arvutiteadlane.
Tehisintellekti arengu üks peamisi takistusi ongi Korjuse sõnul eelkõige see, et kõik mõistlikult kättesaadavad ja kvaliteetsed andmed on juba neile sisse söödetud. "Häid andmeid, mida see arhitektuur hädasti vajab, on suurtes kogustes väga raske juurde saada. Me ei saa panna kümme korda rohkem raha sisse ja saada seejärel kümme korda rohkem andmeid vastu," selgitas arvutiteadlane.
Järgmine suurema hüppe toob multimeedia
Kristjan Korjus näeb praegu silmapiiril kahte lahendust, mis võivad suurte keelemudelite arengule uue hoo sisse anda. Mõlemad on saavutatavad juba praeguse tehnoloogiaga. Esimene ja vahest ka kõige olulisem neist lahendustest on andmete omandamine läbi erinevate meediumite: neurovõrkude treenimisel hakatakse lisaks tekstile appi võtma ka heli, pilti ja video.
"See võimaldaks neurovõrkudel võib-olla isegi hüppeliselt paremaks muutuda. Niimoodi saaks nad maailma veel paremini mõistma õppida, just nagu väike laps õpib kuuldes ja nähes. Näiteid sellest on juba olemas. OpenAI mudelile 4.0 teksti eriti juurde ei pandudki, küll aga kasutati treenimisel pilte. Loogiline mõtlemine paranes sellest oluliselt, mis siis, et küsid juturobotilt ikkagi ainult tekstiga seotud asju," sõnas teadlane.
Praegu on Korjuse sõnul mudelite treenimist pildi ja heliga ainult natukene katsetatud. Videote kaasamine on veel täiesti tulevikumuusika. See tähendab, et arenguruumi on küllaga ja keegi ei tea, kui palju võib tehisaru loogikavõime edasi areneda kõigi kolme meediumi korraga talletamisest.
Teise lahendusena keelemudelite arengu kiirendamiseks näeb Korjus otsingumootorite kasutamise võime täiustamist. "Inimmõistus ei ole ju ka väga hea igasuguste faktide ja tekstide meelde jätmisel. Teeme näiteks paberile märkmeid ja kasutame neid mõtlemisel. Ka tehismõistus võiks seesmiselt rohkem niimoodi töötada ja õppida paremini otsingumootoreid kasutama. Selles valdkonnas tehakse praegu palju katseid," sõnas ta.
Piduriks võib saada hoopis raha?
Tallinna Tehnikaülikooli suurandmete kaasprofessor Innar Liiv tehisintellekti arengus aeglustumist ei näe, vähemalt mitte tehnilisest ja teaduslikust küljest.
"Tõepoolest, praeguseni on algoritmid sedasi töötanud, et neid piltlikult öeldes kastetakse tohutu hulga andmete sisse. Algoritmid said olla suhteliselt lihtsad, sest andmeid on lihtsalt niivõrd palju," sõnas ta.
"Samas öeldakse, et ühel hetkel peaks kõik inimeste toodetud andmestik otsa saama, olgu nendeks siis avalik internet, inimeste e-maili sisud, Twitteri säutsud ja mida iganes," märkis Liiv.
Tekstiandmete puudus ei pruugi aga probleemiks kunagi saadagi. Nagu tõi välja ka Korjus, on Liivi sõnul hakatud katsetama niinimetatud multimodaalsete keelemudelitega, mis oskavad võtta endasse pilti, heli ja videot. "Nähakse, et niimoodi tekib neurovõrkudel seoseid ikkagi palju rohkem," lisas Liiv.
"OpenAi juht Sam Altman on öelnud, et praegu võib tulla uus suurem tehisaru hüpe iga poole aasta tagant. Kõige suuremat arengupotentsiaali nähaksegi pildi ja video sisestamises. Riistvara ei tohiks samuti takistuseks osutuda. Usun, et tänase riistvara tasemega saab järgmise suurema hüppe kätte küll. Mina küll ei tunneta, et see areng kuidagi aeglustuda võiks," sõnas kaasprofessor.
Küll aga tundub Innar Liivile, et teatav platoo on tekkinud investeerimisjulguses. "Investorid vaatavad nüüd üha enam, et kui nad panevad järgmised 200 miljonit dollarit tehisaru sisse, siis kas selle rahaga tehakse maailmale lihtsalt järjekordne põnev üllatus või tasub see kuidagi äriliselt ka ära?" arutles teadlane.