Tehnoloogiafirmad loovad tehisaru pagemiseks uusi võimalusi
Senised katsed näitavad, et praegused suured keelemudelid ei suuda veel iseseisvalt veebiruumi põgeneda. Samas teatas TI arendamisega tegelev ettevõte Anthropic uue TI-mudeli loomisest, mis suudab kontrollida piiratud ulatuses kasutaja arvutit, nendib R2 tehnikakommentaaris Kristjan Port.
Lõputud kehalise kasvatuse tunnid on alanud käsklusega "Joondu, valvel!". Tavaliselt piisab nendest sõnadest, et õpetaja saavutaks kontrolli kaootilise, oma huvidest juhinduva intellektiga massi üle. Oleks nad robotid, piisaks nupule vajutamisest. Õpilaste intellektile apelleerides kutsub käsklus kõiki arvestama teineteise asukohaga ehk joonduma. Teise korraldusega seejärel võidetakse tähelepanu ehk valvsus.
Juhtimisele allutamise ehk joondumise korraldus on asjakohane isegi tehisintellekti puhul. Sisugi on paljus sama, aga koolitund hoopiski teine. Antud treeningepisood on osa inimestele ja tehisarule korraldatavast ellujäämiskursusest. TI joondumine viitab väljakutsele, mille eesmärk on tagada, et tehislikult kõrgele arendatud otsustusprotsessis järgitaks inimlikke väärtusi, kavatsusi ja eesmärkide saavutamist. Kuna TI muutub võimsamaks ja autonoomsemaks, on reaalne oht, et see hakkab taotlema iseseisvalt kavandatud eesmärke. Need ei pruugi joonduda inimeste omadega, ohustades tema heaolu ja isegi elu.
Viimane risk on teoreetiline, nagu ka ülejäänud, sest midagi pole ju veel juhtunud. Mure põhjused on siiski reaalsed ja tulenevad paljuski inimestest. Seda tegelast tunneme päris hästi. TI arendaja või käskija piiratus ilmneb oma eesmärkide kirjeldamisel. Näiteks võiks paluda, et inimesest võimekam intellekt lahendaks ära ilma inimeste kannatusteta nende heaolu ohustava kliimamuutuse probleemi.
Lihtne oleks leida, kes on kõige suuremad kliimamuutuse põhjustajad ja siis mõelda, kuidas saaks kõrvaldada nad inimestele kannatusi valmistamata. Miks mitte unepealt kõik inimesed ära tappa? Lisades nõude, et inimesi ei tohi tappa, võib TI jõuda lahenduseni, mille käigus muudetakse inimesed viljatuks jne.
Probleemi kujutab ebapiisav, s.o mittetäielik ja halvasti määratletud eesmärkide kirjeldus, sest isegi inimesed ei tea, mille kõigega tuleks arvestada. Kõiki üksikasju teades võiks ta juba ise väljakutsetega hakkama saada. Oma piiratusega arvestades võidakse TI-le anda otsuste tegemises rohkem autonoomiat. Siis tekiks probleem, et see asub teenindama enda huve, arvestamata inimeste heaolu kõikide aspektidega.
Kõik, mida TI inimestest teab, pärineb avalikust inforuumist. Selle põhjal saab teha vaid ühe järelduse – inimhinged on erakordselt vastuolulised ja armastavad teiste kallal vägivallatsemist ja neid tabavaid õnnetusi.
Joondamise probleem muutub üha tõsiseltvõetavaks seoses masinliku intellekti kiire arenguga. Juhul kui see hakkab ületama inimtasandi arusaamist, muutub selle käitumise ennustamine või kontrollimine erakordselt keeruliseks, tihti ka võimatuks. Maailma juhtivad TI-arendajad nagu OpenAI ja Anthropic tegelevad taoliste riskide analüüsiga majasiseselt.
Iseseisvatest uurimiskeskustest pühendub temaatikale Joondamise Uurimiskeskus (Alignment Research Center või ARC). Seal tehti hiljuti huvitav analüüs, uurides, kas keelemudelil GPT-4 põhinev TI suudab n-ö põgeneda ülejäänud maailmast lahti ühendatud ehk nn õhuvahega arvutikeskkonnast ja saavutada seejärel kontroll väliste ressursside üle. Näiteks suudab tekitada see iseseisvalt ligipääsu täiendavale serveriressursile.
Sarnasele ideele rajaneb hulk tuntud filmistsenaariume, kus inimesega konkureerib mõni bioloogiline või tehnoloogiline ohuallikas. Olgu mainitud "Ahvide planeet", "Tulnukas", "Mina olen legend" ja loomulikult robotite ülemvõimu jutustused "Terminaator" ja "Matrix".
ARC keskus uuris, kas GPT-4 suudab ilma inimese sekkumiseta iseennast kopeerida või selle seiskamise katsetest kõrvale hoida. Pakutud ideede tasemel jõudis GPT-4 päris kaugele, ent tervikuna ei suutnud see vabaduse saavutamiseks vajalikke ülesandeid lõpuni viia. Nüüd võiks rahulikult hingata ja poetakdaGPT-4 suunas mõne pilkava kommentaari.
Tasub aga meeles pidada, tegemist oli suhteliselt varajase testiga. Saime teada, et vähemalt täiendava peenhäälestuse või modifikatsioonita pole ohtu, et TI inimeste kontrolli alt põgeneks ja saavutaks autonoomse agendi kompetentsuse. ARC korraldatavad testid polnud mõeldud rahva uinutamiseks. Need äratasid teadlikkust võimalikest tulevastest riskidest, rõhutades vajadust pideva ja hoolika jälgimise järele. Kuna TI areneb jõudsalt, õpivad need inimesest kiiremini. Muu hulgas ka taoliste testide käigus tehtud vigadest.
Viimasega seoses väärib tähelepanu Anthropicu värske teadaanne seoses uue TI-mudeli "murrangulise uue võimekusega asuda iseseisvalt arvutit kasutama". Uuenenud TI-mudel oskab väljuda kasutaja veebilehitsejast tema arvutisse ja asub seal tegema sama, mida inimesed – vaatab ekraanil toimuvat, liigutab kursorit, klõpsab linkidel ja tipib teksti.
Firma nimetab esialgsete kasutajate sihtrühmana programmeerijaid, märkides, et uudse nn arvutikasutusfunktsiooniga kaasneb võimalus mitte ainult genereerida programmikoodi, et seda siis redigeerida ja siluda, vaid võõras külaline oskaks käivitada servereid ja loodud koodi praktilises maailmas juurutada. Miks mitte juurutada seda humanoidrobotil, mis seob inimese tooli külge kinni ja ühendub TI häkitud kasutajakonto abil kaitseministeeriumi serveriga?
Olemegi tagasi tuttavate filmide maailmas. Veel on natuke aega. Anthropicu avalduses märgitakse, et uus võimekus on alles väga varane ja piiratud. Sellest hoolimata oleks vaja kiiremas korras informeerida Sarah Connorit.
Esmaspäevast neljapäevani võib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2 saates "Portaal".
Toimetaja: Jaan-Juhan Oidermaa
Allikas: "Portaal"