Tanel Tammet: rumal tehisaru peletab eestlased võõrasse kultuuriruumi
Kuigi Eesti arvutiteadlased võivad olla oma kitsastes niššides maailma tipus, napib omakeelse laiatarbe-tehisaru loomiseks vahendeid ja võimekust. Eesti keele köögikeeleks muutumise vältimiseks on seetõttu teatav koostöö IT-hiidudega paratamatu, nentis "Reedeses intervjuus" Tallinna Tehnikaülikooli professor Tanel Tammet.
Tanel, kui 1920. aastal pandi Eesti Vabariigi põhiseadusesse kirja, et meie eesmärk on kindlustada ja arendada riiki, mis tagab eesti rahvuse, keele ja kultuuri säilimise läbi aegade, siis vaevalt oleks keegi tulnud selle peale, et veidi enam kui 100 aastat hiljem arutleme tõsimeeli selle üle, kuidas meie keelt ja kultuuri ohustatavad ühelt poolt suurriigid, eeskätt idanaaber, kuid selle kõrval ka tehisaru ning rahvusvahelised tehnoloogiahiiud. Kui palju see teid üllatab, et oleme sellisesse punkti jõudnud?
Arvan, et 1920ndate inimesi üllataks pigem see, et see kõik on nii kaua aega võtnud. Tollal tõusis tehnooptimism väga kiiresti, mis tihtipeale oli ülepingutatud – loodeti, et areng juhtub väga ruttu. Unistati robotitest, Marsi lendudest, lendavatest autodest. Kui vaadata tolleaegseid pilte ja jutte ajakirjadest ning meenutada, kust pärineb sõna "robot" – Karel Čapeki loomingust, siis on selge, et optimismi oli kõvasti.
Seega poleks toonased inimesed praegusest olukorrast üllatunud. Pigem oleksid nad arvanud, et 2001. aastaks peaks olema vähemalt "2001: Kosmoseodüsseia". Oleme jõudnud sellest ajaliselt väga kaugele.
Ajakirjandusväljaannete esiuudised räägivad justiitsminister Liisa Pakosta tegevusest – sellest, kuidas ta juhatas Meta ehk Facebooki emafirma suure hulga Eesti meediaväljaannete artikliteni, et see Ameerika suurfirma saaks arendada oma tehisarurakendust. Räägitakse vajadusest anda ameeriklastele veel üle 16 miljardi sõna. Kuidas Te seda debatti kõrvalt jälgite? Kas see on vaikne alistumine või vältimatu progressiga kaasaminek, et eesti keele ja kultuuri mõju maailmas paremini kaitsta?
Esialgu on see debatt. Mul on tohutult hea meel, et see on nüüd pihta hakanud. Inimesed on aru saanud, et selle teemaga tuleb tegelda. Väiksemad rahvagrupid, kes on juba mõnda aega tehisintellekti, masinõppe ja keelemudelitega tegelenud, on puutunud selle küsimusega kokku pikalt ning see on suur teema. Nüüd tõsteti see Pakosta tegevuse kaudu rambivalgusesse. Mul on seetõttu hea meel, et ta selle sõnavõtu tegi.
Kas tal on siin otseselt õigus midagi öelda või peaks ta koalitsiooniga läbi rääkima, seda ma öelda ei oska. Ent teema nähtavale tõus on hästi positiivne. Lugesin kiirkorras hulga kommentaariume ja arutelugruppe. Näen, et paljude inimeste jaoks on see täiesti uus küsimus – nad ei ole sellega varem kokku puutunud.
Avaksin seetõttu natuke tausta, miks see nii oluline on. Teadupärast on ChatGPT, Hiina Deep Seeki, Meta Llama ning paljude teiste suurte keelemudelite ehitamisel üks kriitiline osa see, et pead neile andma suurel hulgal teksti, mida mudelid loevad ja mille põhjal õpivad. Nad õpivad seda, mis seal tekstis on. Seda, mida tekstis ei ole, nad ei õpi, seal hakkavad nad puuduvaid seoseid ise oletama: vahel läheb pihta, vahel mitte.
Kui küsime nendelt mudelitelt midagi eesti keeles, siis see üldiselt töötab – ChatGTP räägib eesti keeles suhteliselt okeilt, kuid teeb vigu. Samuti teab see Eesti asjadest palju vähem kui näiteks Ameerika, Suurbritannia või Saksamaa omadest ehk info on puudulik. Keeleoskused on samuti natuke puudulikud. Ilmselt see nii ka jääb ning see on suur probleem üle maailma: väiksemate keelte puhul on keeruline tagada, et keelemudelid neid hästi õpiksid, sest teksti on lihtsalt vähem.
Kui tahame, et keelemudelid suudaksid eesti keelega paremini hakkama saada – olgu see siis Meta mudel või mõni muu, pole muud viisi, kui treenida neid eestikeelsete tekstide põhjal. Ilmselgelt on seniseid mudeleid juba mingil määral eesti keele peal treenitud. Näiteks eestikeelne Vikipeedia on päris suur materjal ning kohe abiks. Samas jääb puudu modernsest, korralikust keelest. Need keelehulgad on väga suured, mida korrektseks treenimiseks vaja on.

Paratamatult peame keelematerjale mudelitele andma, sest muidu räägivad nad kehva eesti keelt. Kui nad räägivad kehva eesti keelt ning teavad kehvasti eesti asju, hakkavad inimesed nendega suhtlema inglise keeles. Kui me neile materjali ei anna, lõikame endale seetõttu sõrme.
Küsimus ei ole selles, kas see ettevõte on Meta või Hiina Deep Seek. Pole mõtet mõelda nii, et hakkame tegema eraldi diile Google'i, Meta, Hiina või Anthropicuga – neid mudeleid on selleks lihtsalt liiga palju ja neid tuleb kogu aeg juurde. Me ei jõua lihtsalt kõigiga eraldi diile teha.
Tegelikult on meil vaja luua võimalikult suur korpus, millele paneme litsentsi, mis lubab kasutada seda keelemudelite treenimiseks. See oleks meie huvides, et seda saaksid teha tehisintellekti-arendajad. Spetsiaalses litsentsis oleks näiteks kirjas, et korpuse tekste ei tohi niisama kopeerida ning mudel ei tohi öelda, et tema kirjutas selle. Saame vajadusel lisada selliseid mõistuspäraseid tingimusi.
See on meie huvides. Keelekorpuste ja Eesti Keele Instituudi inimesed teavad seda kõike, nad on sellega tegelenud ning neil on sellega probleem. Suur hulk eesti keele tekste on suletud litsentsiga ning neid ei saa vabalt välja anda. Selles mõttes on Pakosta kriitikutel kaudselt õigus – minister ei saa öelda, et anname välja kõik eestikeelsed tekstid. Peame jõudma aga sinna kohta, et saame neid keelemudeleid treenida. Selles mõttes on see diskussioon tohutult tähtis.
Ühelt poolt taandub kogu see vaidlus rahale – ajakirjandusväljaanded ja kirjastajad on investeerinud raha loomingusse, samal ajal kui suured meediahiiud toimetavad siin ning teenivad kasumit ilma, et maksutulu Eestisse jääks. Laiemas vaates – ütlete, et kui me sellele rongile ei hüppa, jääme muust maailmast maha. Milles seisneb see laiem võlu, kui tehisintellekt mitte ainult ei räägi eesti keelt, vaid on lugenud "Tõde ja õigust" ning vaadanud ära kõik "Aktuaalse kaamera" saated?
Häda ei ole mitte see, et jääme rongist maha, mida ei juhtu, vaid me ei täida oma põhiseaduslikku ülesannet säilitada eesti keelt ja kultuuri. Kui meil pole piisavalt hästi eesti keelt rääkivat tehisintellekti, mis tunneb hästi Eesti asju ja kultuuri, hakkame temaga rääkima inglise keeles. See tähendab, et lülitume tasapisi ümber teise kultuuri niipea, kui hakkame tehisintellektiga suhestuma.
Hästi, aga mis vahet seal on, kas räägime tulevikus oma külmkapiga või robottolmuimejaga inglise või eesti keeles?
See on väga õige küsimus. Võime mõelda ka nii, et jätame eesti keele vaid köögikeeleks. See on tegelikult eksistentsiaalne küsimus nii eesti kui ka kõigi väikeste kultuuride jaoks – kas olla või mitte olla? Olen üsna veendunud, et rõhuv enamus Eesti inimesi leiab, et meie kultuuril on oluline väärtus. See pole küsimus. Eesti põhiseadusesse on meie keele ja kultuuri säilitamise kohustus kirja pandud põhjusega. Väga väike osa inimestest arvab, et eesti kultuuri võiks nurka visata.
Niipea kui rahvas aru saab, mis on keele ja kultuuri säilimiseks ja arenemiseks oluline, ei teki väga palju küsimusi, mida selleks vaja teha on. Lihtsalt me ei tea kohe alguses, millised väljakutsed meid ootavad. Praegu on aga pilt juba piisavalt selge.
Tuleb rääkida sellest, miks anti keelematerjal just Metale. Keelemudeleid on väga palju. Ka Eestis treenitakse keelemudeleid nii eksperimentaalselt kui ka tõsisemalt ning seda jäädakse tegema. Eesti keelemudelite treenijatel on vaja samamoodi eestikeelseid tekste. On keeruline teha nii, et ühed mudelitreenijad saavad neid tekste ja teised ei saa. Raha hakatakse küsima ka eesti treenijatelt ja neil ei ole seda anda. See ei ole väga realistlik.

Kui mõtleme meediaväljaannete tekstide rahalisele väärtusele, siis enamasti on need juba natukene vananenud tekstid. Me ei räägi siin tuhandeaastastest eepostest, mille puhul on kontekst teine. Ilmselgelt ei saa keegi poole aasta või aasta vanuse teksti eest raha. Seega on see rahateema sulepeast välja imetud – keegi ei kavatse ilmselt nende tekstide eest maksta.
Üldise arusaamana teevad keelemudelite treenijad enda arvates ühiskonnale heateo, kui treenivad mudeleid eri keelte peal. Nad teevad seda meeleldi, sest nad oletavad, et see võib parandada üldist pilti ning see on huvitav eksperimenteerimiseks. Pigem vaadatakse, et see on nende huvides, kelle tekstide peal neid mudeleid treenitakse. See on täitsa loogiline.
Nüüd vihastasite ilmselt paljud mu kolleegid välja ning leiate oma nime õhtuste artiklite pealkirjadest. Üks näide on meist palju väiksem keel, islandi keel. Islandi riik oli üks esimesi, kes liitus tehisintellekti keeleprogrammiga ning on öelnud, et läheb selle arenguga kaasa. Kas Eestis jõuab see debatt lõpuks samasse punkti? Kas see on vältimatu?
Ma ei julge päris täpselt öelda, kuhu see lõpuks välja jõuab, sest miski tulevikus pole täiesti vältimatu. Kuhugi me ilmselt jõuame selle alanud debatiga, loodetavasti enam-vähem mõistlikku kohta. Neid mõistlikke variante väga palju ei ole. Ma ei oska öelda, kas peaksime jõudma täpselt sinna kohta, kuhu Island, aga kuhugi sinna võiks jõuda.
Eestil on teatud eelised – meie põhikooliklassides õpivad tüdrukud juba programmeerimist ning Eesti riigil on pikaajaline kogemus institutsionaalse IT-riigina. Oleme olnud maailmale eeskujuks. Kui tõenäoline on, et Eesti arendab oma andmete põhjal maailmatasemel tehisaru?
Selle küsimuse tähendus on kaheosaline. Üks asi on see, kas teeme midagi, mis on vägevam kui mujal maailmas – elementaarselt on vastus jah. Teaduses püütakse alati teha midagi, mida keegi teine teinud ei ole. Selleks on paratamatult vaja minna kuskile nišši ning võtta keeruline kitsas probleem, millega pole inimesed jõudnud massiliselt tegeleda. Sellistel asjadel on tavaliselt iva sees, sest kitsas probleem võib laieneda või haakuda mõne teisega. Nendega läheme muidugi edasi. Eestis töötavad teadusrühmad parandavad pidevalt midagi, mida keegi teine pole veel nii hästi suutnud teha.
Teine küsimus on, kas suudame teha maailmatasemel laiatarbekaupa, mis oleks parem kui teised. Näiteks kas teeme parema Nokia telefoni kui Nokia omal ajal või parema laiatarbe ChatGPT, kui OpenAI seda tegi või Google'ist parema otsingumootori. Vastus on ilmselt mitte. Need on väga suured ja keerulised korporatiivsed süsteemid, kes neid ehitavad, et laiatarbesse minna. On muidugi mõned juhtumid, kus Eestis on laiatarbe asju ehitatud, näiteks kunagine Skype, mida sellisena enam ammu ei eksisteeri. Eestis on ka Wise ja Bolt ning need on võimsad.

Tehisintellekti puhul ei ole võimalus väga suur. Võime seda võrrelda keerukuselt lennukitööstusega – kas hakkame seda ise niimoodi tegema. Tulen ringiga tagasi selle juurde, et Eestis on maailmatasemel teadusrühmad, kes tegelevad spetsiifilisemate ülesannetega, mida ei ole keegi suutnud hästi teha. Nende jaoks ei pruugi keelematerjal olla nii kriitiline, sest nad teevad spetsiifilisemaid asju.
Samas on see küllaltki oluline. Kui keelematerjal on kergesti kättesaadav, võib see innustada inimesi sellega mudeleid treenima, et vaadata, kuidas mudelid sellise suurusega materjaliga hakkama saavad. Kui aga ligipääs on keeruline, võivad nad teha midagi muud, mis tundub kergem ja huvitavam. Seetõttu on see ka Eesti-siseselt tähtis.
Olete üsna skeptiline, et Eesti suudab selles suures mängus kaasa mängida. Vaadates aga maailmas toimuvaid trende ja arengut, muutub tehisaru loomine järjest odavamaks. Kas see ei võiks siiski olla meie võimalus?
Kui ütled, et olin skeptiline Eesti osalemise suhtes suures mängus, siis rõhutan selgelt, et väiksemat mängu saame vägagi kaasa mängida. Tegelikult teeme seda juba väga aktiivselt. Eestis tegutseb terve hulk tipptasemel tehisintellekti ja arvutiteadusega tegelevaid gruppe, kes ehitavad asju, mida pole varem ehitatud. Nišid on olulised. Suured tehnoloogilised läbimurded tekivad sageli just nende väiksematele niššidele. Need käivad alt üles, nagu maja ehitamine.
Paratamatult mängivad tehisintellekti arengus suurt rolli kaks riiki – Ameerika Ühendriigid ja Hiina. Viimasel ajal tundub, et Hiina on juhtohjad haaranud. Kas see ongi see, mida kartsime? Et üks maailma suurimaid kommunistlikke riike, mis allub ühele parteile ja ühele liidrile, omab maailma võimsaimat arvutit?
See, mis sa ütlesid, on ilmselt meelega natuke ülepaisutatud. Kindlasti ei oma Hiina maailma võimsaimat arvutit ega ole ka kõige juhtivam riik, kuid nad on sellele üsna lähedal. Kui vaadata arengut riikide kaupa, mis ei pruugi olla alati kõige mõttekam, sest suured tehnoloogiaettevõtted on ise juba multinatsionaalsed, on Ameerika Ühendriikide võimekus tehisintellekti ja laiemalt tehnoloogia arendamisel siiski kõige suurem. Nad on teistest ees.
Hiina on ilmselgelt kohe number kaks nende järel ning selle tehnoloogiline areng on viimastel aastakümnetel olnud väga muljetavaldav. Kui meenutada, siis ammu aega tagasi peeti Hiinat odavate ja kehvade masstoodetud kaupade riigiks, mida on see natukene ka praegu. Samas on nad oma tehnoloogilist ja teaduslikku potentsiaali pidevalt kasvatanud.
Kui vaadata näiteks tehisintellektile pühendatud konverentse või teadusajakirjade artikleid, on näha, et väga suur protsent neist on hiinlaste kirjutatud. Osad Hiina teadlased töötavad Ameerika uurimisrühmades, kuid suur osa tegutseb Hiinas. See ei tähenda, et indialased või eestlased ei mängiks rolli, aga Hiinat on tõesti väga palju. Nad ei ole lihtsalt kopeerijad, vaid leiutavad uusi asju.

Sellel on mitu põhjust. Üks oluline tegur on Hiina elanikkonna kiire vananemine. Pikka aega kehtinud ühe lapse poliitika tekitas demograafilise laviini. Hiina rahvaarv mitte ainult ei kahane veel aastakümneid, vaid elanikkond ka vananeb kiiremini. Tulevikus sarnaneb Hiina Jaapanile – kuigi see ei ole nii väike. Nad näevad seetõttu selgelt, et nad vajavad tehnoloogilist võimekust väga ruttu. Nad ei saa enam loota vähemakstud massile, kes vajalikke asju teevad. India on natukene teistsuguses olukorras – seal elanikkond kasvab.
Hea näide on Deep Seek, mis on viimastel nädalatel palju kõneainet tekitanud, põhjustades aktsiaturgudel kaose ning vapustas kogu lääne ühiskonda. Äkitselt tulid välja tüübid, kes suutsid palju väiksema rahasummaga teha midagi sarnast sellega, mida läänes arendatakse sadade miljardite eest.
Kui need tüübid oleksid tõesti kuskilt äkitselt välja tulnud, oleks see olnud rabav, aga spetsialistide ringis olid nad juba tuntud. Tegemist on väga kuulsa tipptasemel tiimiga, mis on regulaarselt avaldanud silmapaistvaid kasulikke teadusartikleid. Nad on näidanud, kuidas muuta masinõppeprotsesse tõhusamaks ning kuidas optimeerida masinõppeprotsesse. Nad on maailmas õppimisprotsesside efektiivistamise juhtfiguurid.
Miks pole nad seni teinud juhtivat keelemudelit? Võib-olla pole ka Deep Seek praegu veel parim mudel, aga peamise põhjusena on nende ressursid olnud palju väiksemad kui OpenAI-l, Google'il või Metal – kuigi need ei ole olematud. Nad on näidanud, et vajadus on leiutamise ema. Kõige selle järel on nad jõudnud natuke läbimurdelise tulemuseni, mis võimaldab treenida tehisaru kiiremini, odavamalt ja paremini, kui seda on teinud senised treenimisrühmad.
Mis teeb nende tegevuse eriti tähtsaks, on selle ettevõtte avatus. Deep Seek räägib oma asjadest ja tehnoloogiatest kümme korda lahtisemate kaartidega kui näiteks OpenAI, kellel on avatus ainult nimes.
Kas DeepSeeki asutaja Liang Wenfeng saab olema uus Elon Musk?
Seda ma ei oska öelda. Pean siiski üsna ebatõenäoliseks, et maailmas palju uusi Elon Muske juurde tuleb. Ta on meie ühiskonnas ikka päris ebanormaalne juhtum.
Seda olukorda on nimetatud tehnoloogiliseks külmaks sõjaks. USA värske president Donald Trump kehtestas Hiinale imporditariifid, samas Hiinal on kontroll paljude Ameerika Ühendriikide taristuobjektide üle tänu tarkvarale. Kui palju hakkab see mõjutama suur pilti maailmas ning Eesti julgeolekut?
See mõjutab kogu aeg. Kui rääkida tariifidest, siis ühelt poolt on see kaubanduspoliitiline teema. Teisalt on USA juba pikka aega piiranud Hiina suunas oma tehnoloogia eksporti. Viimastel aastakümnetel on see eriti puudutanud arvutiprotsessoreid.
Enne kui tehisintellekt muutus suureks ja praktiliseks ning oli pigem nišivaldkond, keskendusid piirangud eelkõige sellele, et oleks raskem ehitada sõjalise otstarbega arvutitele. Sõjalisi arvuteid on väga erinevat sorti – näiteks tuumapommide arendamisel on vaja simuleerida plahvatuste mõju. Mida rohkem on arvuteid, seda paremini saab neid simulatsioone läbi viia. See oli üks põhjustest.
Drooninduses on kõigepealt vaja riistvara – protsessoreid, seejärel masinõpet, et arendada paremaid programme ning neid katsetada. Arvutite ja tehisintellekti kasutamine militaarotstarbel kasvab praegu väga kiiresti. Maailm on muutunud närviliseks – on pidev hirm Taiwani pärast, Hiina võib kujutada ohtu ka Jaapanile ning kui Hiina suurendaks Venemaa toetamist, muutub see ka Euroopa jaoks probleemiks jne. Teisisõnu on sõjaline pinge ja vastasseis selgelt kasvanud.
USA-s tekkis loogiline mõte, kas ja kuidas võiks piirata teatud eksporte, et aeglustada vastaste arengut või säilitada tehnoloogiline edumaa. Deep Seeki uute tehisintellekti mudelite avaldamine andis sellele protsessile äkilise hoobi. Nähtub, et meil ei ole kerge midagi peatada.
See ei tähenda, et me midagi teha ei suudaks. Mida rohkem protsessoreid Hiina suunal liigub ning mida odavam see on, seda lihtsam on neil eksperimenteerida. See arendustöö on aga väga eksperimentaalne – proovides erinevaid lähenemisi, leitakse lõpuks ka töötavaid lahendusi. Mida rohkem teadusrühmi katsetab, seda rohkem kasulikke asju tuleb välja.

Sellel kõigel on kindlasti mõju, kuid see pole olnud tugev. Sellised ootamatud hoobid ei tulnud ilmselt kõigi jaoks ootamatuna. Võib kahtlustada, et see ajastus oli seotud USA tegevusega – see ei pruugi olla pelgalt juhus, et just siis, kui Ühendriigid kehtestasid teatud piirangud ning tegid teatud avaldusi, otsustati need mudelid täielikult avalikustada.
Deep Seek oleks võinud luua piiratud ligipääsuga lehe, kus kasutajad oleksid saanud neid mudeleid katsetada sarnaselt OpenAI-le. Nad tegid aga teadliku otsuse muuta need veelgi avalikumaks kui Meta. Meta on kogu aeg järginud põhimõtet, et annab oma tehisintellekti mudeleid tasuta kasutamiseks, võimaldades inimestel neid oma masinates kasutada. Väiksemad Meta mudelite variandid töötavad ka sülearvutitel, kuid mitte väga hästi. Kui soovid korralikumat värki, on vaja suuremat arvutusressurssi, kuid see pole midagi üle mõistuse käivat.
Deep Seeki saab samamoodi alla laadida, koju mobiili päris mitte, aga kuskile organisatsiooni serverisse nagu naksti, panna see käima ning sul pole vaja oma andmeid üle interneti Hiinasse suunata. Võid kümneid käima panna, neid ise üle treenida ning hakata tegema nendega igasugu asju. Selle valdkonna arengu jaoks on tohutu asi, kui sul on hea tasemega avalikult kasutatavad ja allalaaditavad tehisintellektisüsteemid. Olukord on läinud nüüd palju paremaks, sest Meta varasemad mudelid olid selgelt kehvemad kui Deep Seeki oma.
Hiina puhul rõhutatakse pidevalt, et sealsed tehnoloogiaettevõtted ei ole vabad ning alluvad või allutatakse vajadusel poliitilistele soovidele. Samas näeme murettekitavat arengut ka lääneriikides. Maailma rikkaim ja mõjukaim mees Elon Musk, kellest oleme juba rääkinud, kuulub USA administratsiooni. Meta juht ja omanik Mark Zuckerberg tegi Trumpile meelepäraseid muudatusi Facebookis, eemaldades näiteks faktikontrolli tööriista. Kui ettevaatlikud peaksime olema olukorra suhtes, kus tehnohiiud teevad koostööd poliitikutega?
Esimene paratamatu tõdemus on see, et me ei saa seda arengut mõjutada. Samuti on keeruline prognoosida, mis edasi juhtub.
Mul on selle teema kohta üks kindel arvamus – automatiseerimistehnoloogia areng, isegi ilma tehisintellektita, kipub majandust pigem tsentraliseerima kui hajutama. See kehtib nii kõige väiksemate arvutite ja mikrokontrollerite kui ka tavapäraste tarkvaraprogrammide kohta, mida kasutavad näiteks Bolt ja Uber. Kõik need tehnoloogiad koondavad võimu ja ressursse pigem tsentraalselt, kui jaotavad neid laiali.
Hajutamine tähendab, et saad luua ise väikese idufirma – olgu see 10- või 100-liikmeline ettevõte. Tsentraliseerimine aga tähendab, et suured korporatsioonid võtavad majanduses üha suurema osa enda kätte.
Näiteks ei ole Amazon kaubandust täielikult üle võtnud – väikseid poode on endiselt alles, kuid see on hõivanud väga suure osa turust. Sama kehtib reklaamituru kohta, kus Google ja Meta on enda alla koondanud turust suure osa, kuid mitte tervikuna. Samamoodi on Eestis teinud seda Bolt taksonduses, surudes konkurentsi alla ning manipuleerides turuga. Mõnele võib tunduda see kasulik, kuid paljudele mitte. Igal juhul on sellel tsentraliseeriv mõju.
Kui tekivad suured, poolmonopoolse staatusega korporatsioonid, hakkavad need mõjutama ka majandust. Ajalugu on näidanud, et selline protsess on paratamatu. Praegu näeme seda väga selgelt – USA-s on suurkorporatsioonide juhid ja omanikud hakanud poliitikas rolli mängima. Elon Musk on selle protsessi üks silmapaistvamaid näiteid.

Tehisintellekti kiire areng kiirendab seda protsessi veelgi. AI võimaldab kiiremat ja täpsemat automatiseerimist ning tarkvara loomist. Paljusid keelemudeleid kasutatakse juba praegu programmeerijate abistamiseks – näiteks kui arendaja peab kirjutama programmi osa, võib ta seda lühidalt inglise keeles kirjeldada ning keelemudel genereerib vajaliku koodi.
See suurendab programmeerijate efektiivsust ning võimaldab neil kiiremini rohkem ära teha. Lisaks suudavad tehisintellekt ja masinnägemise süsteemid üha enam iseseisvalt tegutseda. Näib, et oleme sisenemas perioodi, kus automatiseerimine kiireneb märkimisväärselt – vahepeal oli justkui platoo.
Kui kaugel oleme olukorrast, kus tehisaru hakkab otseselt kujundama börsistrateegiaid ja finantsinstrumente majanduse mõjutamiseks? Seda enam, et praegu on ka majanduses suund efektiivistamisele, kokkuhoiule ja kärpimisele – kõik tahavad töötajaid vabastada ning arvuteid asemele võtta.
Tegelikult on majandus alati suunatud efektiivistamisele – vahele natuke rohkem, vahel vähem. Ka börsi areng on pigem sujuv, kuigi tajume seda vahel suurte hüpetena. Kui tuleb uus OpenAI või Deep Seeki keelemudel, võib see tunduda justkui komeet, mis on ootamatult maa peale kukkunud, kuid tegelikult see päris nii ei ole. Areng käib väiksemate sammudena, kuid jõuab avalikku teadvusesse suurte hüpetena. Selle taga käib loomulik sujuv areng.
Näiteks börsil on kauplemist automatiseeritud pikka aega. Seal kasutatakse hulgaliselt automaatsüsteeme, mille reguleerimiseks on aastaid kehtestatud erinevaid piiranguid. New Yorgi börsil on kindlad ajaperioodid, mil teatud algoritmid tohivad tegutseda ning millal mitte. Sellel on omad põhjused – on olnud olukordi, kus piiranguteta tegutsenud süsteemid on hakanud tegema midagi väga imelikku. Ebanormaalsete börsikõikumiste eest kaitsmiseks on kehtestatud reeglid. Selles ei ole midagi uut ega traagilist.
Kas keelemudelid aitavad selles vallas? Olen selle suhtes väga skeptiline. Üldiselt on börsihindu väga raske ette ennustada – isegi kui keegi on väga tark inimene, ei suuda ta seda täpselt prognoosida. See on ikkagi suuresti pooljuhuslik protsess, kus ka väga väikesed mõjurid võivad suurt mõju avaldada.
Kui vaatame, mida keelemudelid üldse teavad, siis nende suurim probleem on see, et nad teavad tegelikust maailmast erakordselt vähe. Nad on õppinud ainult nende tekstide põhjal, mis parasjagu maailmas toimub, sellest ei ole keelemudelitel mingit ettekujutust. Isegi kui need teaksid, mis toimub, ei ole nad loodud selleks, et selle teadmisega midagi ette võtta.
Kui hästi me tegelikult mõistame, mismoodi see must kast töötab? Kuivõrd oleme valmis olukordadeks, kus tehisintellekt ei allu enam meie kontrollile, omandab oma agentsuse, emotsioonid ja isegi eneseteadvuse? Kas see on utoopia?
Sellise küsimuse puhul võib minna tähenärimisse – mida tähendab agentsus ning mis on utoopia. Kuna me ei oska neile küsimustele hästi vastata, ei tule ka vastus hästi välja. Siiski on inimestel hirm ning see ei ole sugugi absurdne. Peamine põhjus on see, et on erakordselt keeruline ette prognoosida, mis võib juhtuda.
Teine aspekt on see, et me ei tea tegelikult kuigi palju inimese, koera või hiire aju töö kohta. See on must kast – teame palju üksikuid detaile, kuid fundamentaalsed küsimused, kuidas näiteks mälu loomadel täpselt töötab, on endiselt vastuseta. Kõik olulisemad asjad, millest võiks eeldada, et ajuteadlased nende kohta midagi teavad, on tegelikult veel selgitamata. Ka teadlased ise ei usu, et nad suudavad seda lähima paarikümne aasta jooksul muuta.
Kuna me seda ei tea ning ei oska tehnoloogia arengut hästi prognoosida, võib juhtuda kõiksugu imelikke asju. Võib hinnata, mis tundub realistlikum ning mis vähem. Mulle ei tundu näiteks eriti realistlik, et tehisintellekt võtab lähitulevikus asjad üle. See, mida teame sellest, kuidas tehisintellekt töötab, on pigem lihtsakoelisem, kui sageli arvatakse.
Teiselt poolt öeldakse, et kogu see areng toimub eksponentsiaalselt.
Jah, kuid eksponentsiaalne kasv on alati näiline – mitte miski ei kasva lõputult eksponentsiaalselt. Alati on tegemist S-kujulise kasvukõveraga.
Alguses tõuseb kõver aeglaselt, siis läheb üles väga kiiresti ning tundub mõnda aega eksponentsiaalsena, mida see natuke aega ongi. Seejärel hakkavad ressursid, mis seda kiiret kasvu toetasid, kiiresti ammenduma. Kasv aeglustub, kuni see muutub peaaegu lamedaks. See on olnud nii kõigi tehnoloogiliste arengutega – toimub läbimurre, leitakse uus kasutus, areng kiireneb, kuid seejärel nišš ammendatakse. Tehnoloogia ei muutu kasutuks, aga toimib selles nišis. Edasiminekuks on vaja midagi uut.
Praeguste masinõppe tehnoloogiatega toimub praegu sama protsess. Neid S-kõveraid tuleb veel kõvasti juurde. Mis tempoga need tulevad, seda on keeruline öelda. Olen aga kindel, et praeguste keelemudelite ressursid on jõudmas platoole. Kolm aastat tagasi oli areng veel väga kiire, kuid pärast GPT-4 väljaandmist peaaegu kaks aastat tagasi hakkas hulk rohkete kiipide ja ressurssidega ettevõtteid tegema täpselt sama asja. Kõik nad on loonud sarnase kvaliteediga süsteeme, kuid keegi pole viimase kahe aasta jooksul suutnud teha ühtegi suurt läbimurret.
Kas võib olla, et kümne aasta pärast suhtume kogu sellesse teemasse palju kergemalt? Näeme tehisintellekti kasuliku tööriistana – näiteks aitab see ajakirjanikul küsimusi välja mõelda, pastoril jumalateenistust läbi viia või ka sõjaväljal droone alla lasta. Kuid eksistentsiaalset ohtu, et tehisintellekt inimkonna üle võtaks, ei teki?
See tundub täiesti võimaliku stsenaariumina ning mulle endale ka kõige tõenäolisemana, et kümne aasta perspektiivis ei juhtu ilmselt midagi väga drastilist. Enamasti on see areng aeglane.
Kui vaadata 30–40 aasta kaugusele, oleksin juba vähem kindel. Võime ka mõelda, mis juhtub tuhande aasta pärast, aga on ilmselge, et me ei suuda sellist tulevikku prognoosida, ent 100–200 aastaga võivad juhtuda väga ootamatud asjad. Ma ei välistaks kuidagi, et eksistentsiaalsed ohud on päris, kuid need ei realiseeru nii ruttu. Võib aga juhtuda, et autojuhid ja ajakirjanikud jäävad järjest enam tööst ilma ning kogu ühiskond hakkab drastiliselt muutuma. Võib-olla hakkame olema üha enam virtuaalreaalsuses, kui selle kvaliteet paraneb ning sinna on mõtet minna.
Sellised muutused on väga realistlikud ja hakkavadki juhtuma. Need on päris mured, kuid pole mõtet mõelda, et mul pole mõtet järgmisel aastal kooli minna, sest kogu töö võetakse ära ning mulle pannakse prillid ette. Nii kindlasti ei juhtu.
Kui palju peaksime tegelema vanemaealistega, kes olid juba interneti tulekuga raskustes? Tekkis digitaalne lõhe põlvkondade vahel. Kas midagi sellist võib juhtuda ka nüüd, kus nooremad inimesed kasutavad väga aktiivselt tehisintellekti ning nende elu muutub lihtsamaks, samas kui vanemad inimesed ei leia sellest endale midagi kasulikku või ei oska seda kasutada?
See on väga hea küsimus. Mul oleks hea meel, kui oskaksin sellele vastata. Tegelikult on asi sageli pigem motivatsioonis ja soovis kui oskustes. Kui õpetan tudengeid, näen selgelt, et ka tudengid ei ole kõik ühesugused – mõnel on motivatsiooni rohkem ühe, teisel teise asja vastu.
Vanemad inimesed kipuvad olema teadupärast konservatiivsemad. Neil on pikalt sisse harjutatud mugavustsoon ning sa ei ürita siis väga uusi asju õppida. Sa ei õpi internetti kasutama mitte seepärast, et see on raske, vaid see pole mugav. Kui autod tulid, ütlesid vanemad inimesed ilmselt samuti: "Mis ma selle autoga jamama hakkan, olen harjunud hobust rakendama."
Kas peaksime sellega kuidagi eraldi tegelema? Kas vanematel inimestel võiks olla praktilisi kasutusvõimalusi tehisintellektist? Kas see võiks aidata neid nende igapäevaste probleemide ja murede lahendamisel?
Muidugi võiks, kuid ma ei usu, et siin on fundamentaalset vahet vanemate, nooremate või keskealiste inimeste vahel. Inimesed on suhteliselt erinevad ja laias laastus sõltub kõik motivatsioonist ning õppimislaiskusest. Ma ei usu, et on mingi eriline koht, kus neid aidata tuleb.
Mõned aastad tagasi räägiti, et me ei ole tehisintellekti tulekuks valmis ning ei oska ette näha selle tagajärgi. Näiteks ilmusid turule rakendused, mis lubasid näidata, kuidas inimene võiks välja näha 20–30 aasta pärast. Hiljem selgus, et neid andmed – fotod ja videod, mida kasutajad üles laadisid, kasutati näotuvastusprogrammide väljaõppeks. Praeguseks on süvavõltsingud muutunud elu igapäevaseks osaks – neid kasutatakse nii poliitikas kui ka näiteks pornograafiatööstuses. Millisteks ohtudeks peaksime selles mõttes valmis olema? Kuhu see tehnoloogia veel edasi võib liikuda?
Tegelikult ei ole mul nende asjade suhtes väga palju hirme, peamiselt seetõttu, et see areng ei ole ülikiire. Ajalooliselt on näha, et ühiskond ja kõikvõimalikud väikesed mehhanismid selle sees adapteeruvad sellega, mis toimub.
Kui mõelda hoopis teistele drastilistele sündmustele, näiteks Ukraina sõjale või kunagisele Eesti iseseisvumisele, siis inimesed kohanesid väga kiiresti. Võrreldes selliste sündmustega ei ole tehnoloogiline areng sugugi nii järsk. Seega ei ole põhjust suurt muret tunda, sest kohaneme ka nendega.
Näiteks süvavõltsingutega oleme juba adapteerunud. Pigem on tore, et neid asju saab teha ning nendel asjadel on positiivsed küljed olnud palju paremad. On mõnus, et saame teha eri pilte, kui see on mõni normaalne, mitte pornograafiline pilt. See on huvitav ja sellest pole midagi halba tulnud.

Tegelikult on kriitikameel meil säilinud – mida enam muutub see tavaliseks, seda paremini oskame ka probleemseid kohti läbi näha.
Just nii. Mingis mõttes oli ajajärk, kus inimesed uskusid, et foto on absoluutne tõde, vaid lühike ja ebanormaalne periood ajaloos. Kui mõtleme ajas tagasi, siis üle 100 aasta tagasi fotosid veel laialdaselt ei tehtud. Kui keegi midagi joonistas, ei uskunud keegi, et see tegelikult juhtus. Mingis mõttes läheme normaalsuse juurde tagasi.
Hiina tehnoloogia kiire arengu tõttu on riigiasutused teatud mõttes kahvlis – nad ei julge Hiina tarkvara oma serveritesse laadida, samas kui kurjategijad kasutavad seda juba väga vilkalt. Deep Seek on praegu kõige populaarsem tehisintellekti platvorm.
Võib-olla see juba ongi nii, ma ei oska öelda. Strateegiliselt on see muidugi õige, et tavainimesel ei ole vaja Hiina tehnoloogia pärast üleliia muretseda, kuid vaadates geopoliitilisel tasemel, mida peaksid tegema riigiasutused, sõjaväelased ja ametnikud, seal on küll vaja tark olla ning mitte sõltuda Hiina tehnoloogiatest.
Põhjus on ilmselge – kui tekivad kriisiolukorrad, mis süvenevad, olgu need majanduslikud või sõjalised, siis niipea kui sõltume mõnest Hiina tehnoloogiast, on meil peas alati mõte, et nad võivad selle kinni keerata või kasutada meie vastu. Võib-olla ei tee nad seda kunagi, aga see oht hakkab sind mõjutama.
Lisaks võib juhtuda, et nad teevadki seda ning võivad öelda, et see läks rikki. Näiteks kui meie elektrivõrk ja alajaamad oleks üles ehitatud Hiina seadmetele ning Hiina otsustaks Venemaaga kokku leppida, et korraldada meie jaoks mõni "demonstratsioon" maine kahjustamiseks, võiksid nad anda Venemaa poolkuritegelikele gängidele ja riigiasutustele juhised, kuidas süsteeme häirida. Kui nad paneks meie juhtsüsteemid kinni, tekiks Eestis tohutu jama, kuid ametlikult võiks Hiina öelda: "Meie pole midagi teinud, siin läks midagi rikki ja keegi ei saa jälile."
Sellised stsenaariumid on suhteliselt realistlikud ning seepärast on parem vältida seda, et me ei peaks pidevalt muretsema selle pärast.
Tanel, millal Te viimati ise mõnda tehisaru funktsiooni kasutasite?
Siin on kaks poolt – olen nagu kingsepp, kellel endal pole kingi. Kuna tegelen tehisaru arendamisega, kuid mitte otseselt keelemudelite õpetamisega, vaid natuke teistsuguste asjadega, on need kõik siiski keelemudelitega seotud. Katsetan, kuidas keelemudelid erinevate ülesannetega hakkama saavad ning kas need sobivad minu uurimistöö jaoks. Seega katsetan neid kogu aeg.
See ei tähenda, et teeksin seda iga päev kaheksast viieni, vaid teen seda episoodiliselt. Olen proovinud neid vahetevahel artikli kirjutamisel, kuid siiani olen näinud, et seda jama on rohkem, kui asi väärt on – stiil ei tule täpselt selline, nagu mulle meeldib. Muidugi, kui hakkasin rohkem katsetama ning juhendaksin mudelit täpsemalt, tuleks see ilmselt välja, aga peaksin selle nimel pingutama.
Kuna ma nagunii nendega kokku puutun, on minu uudishimu rahuldatud. Ma ei välista, et hakkan neid iga päev kasutama, kui nende kvaliteet tõuseb. Praegu on see piiripeal.
Mis oli viimane eluline olukord, kus tehisarust päriselt abi oli? Tõsi, ta teeb lapsikuid vigu, aga mõnikord suudab ta siiski üllatada oma võimekusega.
Ma ei oska tuua ühtegi olukorda, kus keelemudelist oleks mulle olnud praktilist abi. Seda pole kordagi juhtunud, aga see võib olla ka professionaalse kretinismi viga – kaldun neid rohkem katsetamise viisil vaatama ning ei ole seetõttu sobiv sihtmärk. Ilmselt jõuab sellele vaatamata kätte hetk, kus tunnen, et seda abi on tõesti vaja, aga ma pole seni võib-olla ise piisavalt püüdnud selles suunas.
Tundsin tehisintellektist päriselt kasu puhkusereisil, kui pidin kirjutama autorendifirmale ühe tusase kirja. Selle asemel, et kulutada tund aega pika ja lohiseva ingliskeelse kaebekirja koostamisele, kasutasin kõnerobotit, mis kirjutas sellele firmale väga adekvaatse ja mõjusa teksti, millele oli võimatu mitte vastata. Teatud mõttes aitab see meil rohkem inimeseks jääda ja tegeleda vähem mõttetu tegevustega.
Arvan, et mõju ongi positiivsem. Kuigi jagan pikaajalist muret, et ohud ühiskonnale ja maailmale on suured, ei juhtu need lühiajaliselt ning on prognoosimatud. Lähiajal on tehisintellekti positiivsed mõjud ilmselt palju-palju tugevamad. Mul on hea meel, et meie edasiminek on ülemaailmne ning Hiina värk on seda arengut edasi tõuganud. Nähtavas tulevikus paistavad need asjad olevat väga head.
Mõned aastad tagasi tegid tuhanded teadlased ja ettevõtjad ühispöördumise, et peatada tehisintellekti areng ning võtta aeg maha. Tegelikult oleme nüüdseks näinud, et seda hambapastat enam tuubi tagasi ei pane.
Arvan, et nad ei tahtnudki panna. Pigem oli hirm selles, et areng võib osutuda väga kiireks ning me ei jõua sellega kohaneda. Nüüd paistab, et kõik on ikkagi suhteliselt normaalne. See areng ei ole nii kiire ning jõuame ilusasti kohaneda. Tegelikult on areng isegi aeglasem, kui tahetakse. Kaks aastat tagasi tundus, et keelemudelite arendajad saavad liikuda edasi veelgi kiiremini ja eksponentsiaalne kasv jätkub, kuid siis hakkas see ära vajuma. Oleksin isegi rõõmus olnud, kui tempo oleks jäänud kiiremaks.
Saan aru ka hirmust – me ei tea tegelikult, kui kiiresti asjad arenevad, parem on olla igaks juhuks ettevaatlik, see pole iseenesest rumal mõte. Paistab, et asi ei ole nii hull.
Toimetaja: Jaan-Juhan Oidermaa