TI-mudelite arendustsükkel läheneb intellektiplahvatuse piirile
Võimsate ja uute oskustega TI-mudelite arendustsükkel on viimase paari aastaga lühenenud sedavõrd jõudsalt, et on paslik meenutada briti matemaatiku Irving John Goodi ideed inimkonna viimasest leiutisest, leiab R2 tehnikakommentaaris Kristjan Port.
2022. aasta lõpus avalikkusele kasutada antud Open AI ChatGPT sai erakordset tähelepanu. Väikeste eranditega enamuse ajast inimese moodi, kuid üliinimlikult paljudel teemadel sujuvalt suhtlev tehisintellekt paelus avalikkuse fantaasiat kohe asetleidvast suurest muutusest. Huvi oli nii suur, et see kogus vaid viie päevaga üle miljoni kasutaja, püstitades omalaadse tehnoloogia kasutusele võtmise rekordi.
Võrdlusena jõudis Instagram sama verstapostini umbes 2,5 kuuga ning Spotify viie kuuga. Twitteri tekitatud ärrituse toel saavutas alternatiiviks või konkurendiks Meta loodud Threads miljoni kasutaja piiri vaid mõne tunniga, seades mõttelise lati uuele kõrgusele.
ChatGPT-d saatis seevastu palju suurem tähelepanu, mille võimekus üllatas ning selle põhjustatud šokis kasutati ülivõrdeid. Kulus natuke aega ning leiti põhjust virisemiseks ja kriitikaks. Sellele järgnes ilma kaljuronimise vaevakisata või mägede vallutamise fanfaarideta kiire kohanemine.
Ei toimunud suuri üleminekurituaale ega kogetud tohutut õppimiskõverat. Oli lihtsalt ekraanide ees vaikiv uudishimu, mis muutus kiiresti harjumuseks. Kui mitte ise kasutades, siis vähemalt olles harjunud, et selleta vist ei toimi enam ükski kool. See on üks vaikiva omaksvõtu põhjustest. Kasutajad alustasid mänguliste küsimuste testimisega, kuni tundus juba imelik, kui ilma selleta püüti lahendada keerukaid probleeme, ei kirjutatud tehnilist teksti ja arvutikoodi või ei loodud ajurünnakute küsimusi.
Mõnes ettevõttes ollakse mures, et TI abil kohalikke probleeme lahendades, lekitatakse võõrasse intellekti oma ärisaladused. Sellega seoses on sündimas uudne saladus. Ajakirjandus on nimetanud neid juhtumeid TI salakaubaveoks. Tegemist on töötajate isikliku TI-kontode kasutamisega tööülesannete täitmiseks. Tööandjatele ja koolidele on TI kasutamine raske väljakutse.
Sestap on hämmastav, kui kiiresti oleme tehisintellekti oma argiellu lõiminud. Uut šokki keegi ei oodanud. Kõik teadsid, kui kallis ja aeganõudev on ühe natukenegi kriitikat taluva TI-süsteemi loomine, kuni kogesid jaanuaris Deepseeki-nimelist šokki. Hiina tehisaru idufirma TI-mudel oli vähemalt sama hea kui senised liidrid, kulutades tulemuse saavutamiseks vaid murdosa nende arenduskuludest ja ajast.
Aktsiaturg reageeris kiiresti. Investoreid tabas kahtlus, et valdkonna juhtide positsioon võib olla arvatust palju nõrgem. Investorite lemmik Nvidia kaotas päeva jooksul turuväärtusest rekordilised 593 miljardit dollarit.
Nüüd oleks vist igav kihla vedada, kui keegi pakuks, kuidas kohe kuuleme kellegi kolmanda, senitundmatu või vähetuntud ettevõtte trügimisest TI esimeste sekka. See seletab võib-olla Elon Muski turundustegevuse kiuste üpris vaoshoitud reaktsioone esmaspäeval avalikkusele tutvustatud x.AI arendatud Grok-3 TI mudeli suhtes.
Omanik lubas talle oma superlatiivides, et tegemist on kõige võimsama TI-ga. Hoolimata sellest, et tal võib olla mõne koha peal põhjust hooplemiseks, pole juhtunu tuum seotud absoluutse paremuse väljaselgitamisega.
Enne väärib siiski tähelepanu see, et uus Grok on saanud testijatelt tunnustust. Seda võrreldakse parimatega turul. Kui veel hiljuti oli moekaks lühendiks suuri keelemudeleid tähistav LLM, siis nüüd on aeg harjuda LRM-i ehk suurte arutlevate TI-mudelitega – Large Reasoning Models. Need analüüsivad küsimuse esitamise hetkest alates, kuidas ülesannet lahendada ning millised on vahetulemid. Arutelukäigule viitab ka Deepseeki mudeli R1 numeratsioonis põrisev "r".
Sestap võiks ükskõikselt tõdeda, et nüüd on valikus üks asine TI juures. See on ka tõsi. Ent sellest palju huvitavam on protsesside kiirus. Grok-3 loodi praktiliselt aastaga. Deepseeki pakutud aja ja rahakulude puhul võib olla skeptiline, aga need on ikkagi väga väikesed. Anthropic asutati mõne aasta eest. Google'i TI-arenduskeskus Deepmind on küll suhteliselt "vana", aga kõigi ühine tunnus on äärmiselt võimekate TI-mudelite üksteisega võisteldes üha kiirenev areng.
Sellega seoses väärib tähelepanu aastate eest levinud idee intelligentsusplahvatusest. Tegemist on kuuekümnendate keskel loodud teoreetiline stsenaariumiga, mida briti matemaatik Irving John Good iseloomustas inimkonna viimase leiutisena. See on masin, mis on võimeline ennast analüüsides looma veelgi võimekamaid masinaid.
Selle loomisega tegelevad kõik TI-kasutajad. Eriti need, kes toovad TI salakaubana tööle, kuna sellega teevad nad end tasahilju mittevajalikuks.
Esmaspäevast neljapäevani võib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2 saates "Portaal".
Toimetaja: Jaan-Juhan Oidermaa
Allikas: "Portaal"