Doktoritöö: Tulevik on tehisintelligentsete partnerite päralt

Inimeste ja arvutite omavahelisest suhtlusest on kirjutatud raamatuid ja vändatud filme – ühena esimestest meenus Spike Jonze’ “Temake” Joaquin Phoenix’iga peaosas –, mis kompavad lävimise piire ning uurivad, kui kaugele ulatub inimese tehno-optimism. Kartus, et suhe arvutiga “üle pea” võiks kasvada, ei hoia teadlasi tagasi võimalikult inimese sarnase, õppimisvõimelise ja empaatilise tehisintellekti loomisel.
Vähem ulmelise, kuid siiski piisavalt intrigeeriva teadusprojektiga on lõpusirgele jõudnud Tartu ülikooli eesti ja üldkeeleteaduste instituudi doktorant Siiri Pärkson, keda juba magistriõpingute ajal hakkas huvitama keele abil masinaga suhtlemine.
Kui näiteks inglise keele jaoks on juba ammu ja üsna laialdaselt kasutatud nii suulisi kui ka kirjalikke kõnedialoogsüsteeme automaatsete infoteenuste osutamiseks (nt ülikooliastujate nõustamine, raamatukoguteenuste osutamine, reisiinfo pakkumine, aga ka hoopis personaalsema assistenditeenuse võimaldamine Apple’ operatsioonisüsteemil töötava Siri nimelise intelligentse rakenduse või Windows 10 juurde kuuluva assistendi Corona näol), siis eesti keele jaoks esineb selliseid süsteeme tunduvalt vähem.
Dialoogsüsteem Hambahaldjas tutvustab, mis teemal infot annab ja teatab, et on arvuti.
Kinoagent Alfred, hambahaldjas Annika ja võlur Aivo
Valdavalt vestlusanalüüsil põhinevas väitekirjas tegeleb arvutilingvist Siiri Pärkson suhtlusprobleemidega infodialoogides, mis on töös defineeritud kui “partneri algatatud parandused”, kuigi nende tähendus on laiem kui vaid vigadele osutamine suulises või kirjalikus dialoogis. Laiendatud mõiste alla käivad kõikvõimalikud tõrked suhtluses, aga ka täpsustuste tegemine, selgituste küsimine, tagasiside andmine jne.
Suhtlusprobleemide tekkimise ja nende lahendamise juures on kahtlemata oluline osa valitud meediumil, kui ka info vahetamise viisil (kirjalik/suuline), sõnastusel ja muudel komponentidel. Infodialoogi all mõeldakse kahe inimese või inimese ja arvuti vahelist institutsionaalset suhtlust, milles üks osapool täidab “infoametniku” ehk ühes või mitmes kindlaksmääratud teemavaldkonnas info andja ja teine “kliendi” ehk infootsija rolli.
Analüüsimaterjaliks on töös valitud ulatuslikku ja mitmekülgsesse eestikeelsesse dialoogikorpusse kuuluvad suulised ja kirjalikud dialoogid (töös on analüüsitud üle 500 dialoogi), et neid omavahel võrrelda. Materjali on kogutud mitmesuguste infootsingu keskkondade kaudu. Näiteks pakuvad seesugust materjali keeletehnoloogia teaduri Margus Treumuthi loodud hambaravinõuande süsteem Hambahaldjas, milles konsultant Annika, kes on tegelikult arvuti, vastab hamba- ja igemeravi ning implantaatide ja proteeside kohta käivatele küsimustele, kuid rõhutab oma tervitustekstis, et tema nõuanded on mõeldud eelinfo hankimiseks antud küsimustes ega asenda visiiti hambaarsti juurde.
Uurimusse on kaasatud samuti Treumuthi loodud Tartu kinode programmi tundev Alfred, kellelt saab kinohuviline teada, missugune film millal ekraanil on ning isegi filmisoovitusi. Töös leidub siiski ka tore illustreeriv näide Alfredi ja “kliendi” sõnavahetusest, milles Alfred näitab oma teadmisi ka väljaspool kinoampluaad.
Väljavõte Siiri Pärksoni doktoritööst, lk 26.
Pärkson on oma töös võtnud kasutusele ka Võlur OZ-i eksperimendina tuntud katsed, milles katseisikule jäetakse mulje, et ta suhtleb arvutiga, antud juhul dialoogsüsteem Aivoga. Tegelikkuses on teisel pool ekraani siiski inimene ehk katse läbiviija, kes peab kasutajaliidese kaudu suheldes täitma etteantud juhiseid vestlusstiili, sõnavara, sobivalt doseeritud infohulga, faktipõhisuse ja muude taoliste printsiipide osas, et jätta võimalikult ehe mulje intelligentsest arvutisüsteemist. Siinjuures on oluline, et “arvuti” vastused oleksid võimalikult kiired, kuivõrd juba pikem kui 10-sekundiline ooteaeg on inimesele häiriv ja raskendab teemale keskendumist.
Võlur OZi eksperimente viidi läbi kahel korral. 2001. aastal toimunud eksperimendis pakkus Aivo teavet Eesti-sisese bussiliikluse, Tartu-Helsingi lennuliikluse ja Tallinn-Helsingi laevaliikluse kohta. “Võlur” oskas samuti mitut reisi omavahel kombineerida.
2009. aastal läbi viidud eksperimendiks oli Aivo repertuaari lisatud juba rohkem teemasid, näiteks vahendas ta ilmateadet, andis infot telekavade, poliitika, lennuliinide ning ka Tartu kinodes toimuva kohta. Kinoinfo sisaldas teavet piletite kohta ja seansside algusaegu ja muud sarnast, samuti teadis Aivo üht-teist ekraanile jõudnud filmide sisust ja osalevatest näitlejatest.
Kuigi Võlur OZ-i meetod on üpris rikkalik ja võib sisaldada lisaks suulisele või kirjalikule dialoogile, milles osaleb korraga ka rohkem katsealuseid ning mis võivad sisaldada ka videoülesvõtteid dialoogi toimumisest, on Pärkson jäänud lihtsa üks-ühele kirjaliku suhtluse juurde, kuivõrd taoline eksperiment oli tema jaoks esmakordne. Sel eesmärgil, et “tehissüsteem” Aivo tunduks kasutajatele võimalikult veenev, pidi arvutit simuleeriv uurija järgima teatud piiranguid. Näiteks püüdma olla tavapärasest (ehk inimlikus mõttes spontaanselt) vähem koostööaldis ja lükkama tagasi sellised juhised, mis sisaldavad sõnu ja mõisteid, mida tehislik süsteem tõenäoliselt ei mõista. Näiteks tõlgendas “arvuti” katseisiku lohutavat ütlust: “Ära põe!” selliselt, et küsis vastu, kas tema vestluspartnerit huvitab info tervisesaadete kohta.
Samuti pidi “võlur” aeg-ajalt teesklema n-ö tuvastamisvigu, loobuma juhistest, mis eeldavad vihjetest arusaamist, ignoreerima või keelduma päringust, mis on liiga ebamäärased ning sisaldavad ebaviisakat kõnepruuki või dialoogsüsteemi teemaga mitte seotud küsimusi, samuti ebatavalist sõnavara. Üldiselt on loodud dialoogisüsteemid initsiatiivikad algatusvõimelised ning alustavad vestlust esimesena ka siis, kui “klient” vaikib ning ärgitavad teda teatud intervalli tagant omapoolses kõnevoorus osalema.
“Mida arvuti sööb ja joob?”
Omaette humoorika ülevaate saaks töös kirjeldatud dialoogide käigus arvutile või arvutisimulatsioonile esitatud küsimustest, milles inimesed kalduvad kõrvale juturobotile ette antud teemast ja asuvad süsteemi proovile panema. Näiteks tuntakse huvi selle vastu, mida arvuti sööb või joob, millal magab, mitu sõrme tal on, mida ta arvab oma tööst või miks on tal “Michael Jacksoni nina”, vihjates avatarile, kelleks antud juhul oli tulnukat meenutava välimusega Aivo.
Üldjuhul päädisid niisugused teemavälised küsimused, mis mõnel juhul olid veelgi jultunumad või ebaviisakad, arvutipoolse parandusettepanekuga. Jämedakoeline pöördumine süsteemi poole pakub tõendust asjaolule, et inimene on kindel oma suhtluses just arvuti ja mitte inimesest infoametnikuga. Enamasti oli parandusettepanekuks märguanne, et väitest või küsimusest ei ole aru saadud ja see vajab ümbersõnastamist, samuti võis arvuti anda seosetuid vastuseid, konstrueerimata küsimuse kontekstist tulenevat vastust, nagu seda teeks inimene.
Siiri Pärksoni põhiline ülesanne oligi üles leida ja süstematiseerida kõik dialoogides sisalduvaid paranduste algatamise seaduspärasused. Taolisi korduvaid mustreid leidis autor analüüsitud dialoogides kokku 30, mida on enam, kui uurimistööga alustades eeldatud. Lisaks formuleeris ta nende põhjal reegliteks kõige sarnasemad lausevoorud parandussekventsides koos mõningate eranditega.
“Infodialoogides tekib parandus sellises situatsioonis, kus ühel suhtlejatest on kas varasema vestluse või kogemuse põhjal tekkinud ootus, et talle kirjutatakse midagi või pakutakse infot just kindlas vormis ja/või hulgal,” selgitab lingvist. “Kui aga kirjutaja ootust ei täida või teeb seda osaliselt, järgneb enamasti reaktsioon, millega antakse teisele osapoolele probleemist märku. Näiteks võib järgneda üleküsimine või ka soovitus ennast parandada – lisada mõni keeleüksus, teha grammatilisi parandusi, kinnitada varemkirjutatu õigsust, asendada valitud sõna või väljend, kui lausung oli mitmetähenduslik või ebamäärane ja muud taolist.”
Doktoritöö autor rõhutab, et paranduse eesmärk on enamasti suhtlusvooru kui terviku moodustamine, kuid siinjuures võib arusaam tervik(likk)us(es)t suhtlejate vahel erineda, mis omakorda on probleemide allikaks. Lisaks toob ta välja, et dialoogis on suurem tõenäosus probleemi tekkimiseks, kui esineb slängi, võõrkeelseid väljendeid ja võõrsõnu ning ühe-kahesõnalisi lauseid, abisõnu ja küsimusi.
Siiri Pärksoni koostatud 32 reeglit on mõeldud abistama dialoogsüsteemide programmeerijaid eeskätt loomuliku eestikeelse infodialoogi modelleerimiseks. See tähendab, et programmid suudaksid edaspidi esitada ja ka mõista täpsustavaid küsimusi, anda ja võtta vastu tagasisidet ning arvestada suhtluse normide ja tavadega.
“Siin tulebki lingvistide roll ja panus eriti hästi esile,” seletab Pärkson, “üksnes infotehnoloogide tööst ei piisa selleks, et luua keeletundlikku ja inimsuhtlusele lähedast süsteemi.”
Ühena põhijäreldustest tõstab autor esile ka mitmes teises Võlur OZ-i eksperimendi meetodit kasutanud uurimuses kinnitust leidnud tõdemuse, et inimesed kasutavad omavahel teistsuguseid suhtlusstrateegiaid, kui arvutiga suheldes. See väljendub näiteks keelekasutuses: kasutatakse lihtsamat sõnavara, lühemaid-lakoonilisemaid lauseid, välditakse võõrsõnu. Mõnel juhul, nagu väideti eksperimendijärgse tagasiside käigus, pöörasid osalejad õigekirjale suuremat tähelepanu kui sarnases olukorras teise inimesega vestlust arendades.
“Tegelikult selgus dialoogide analüüsist, et see, mida inimesed n-ö lihtsaks keeleks peavad, ei pruugi alati olla lihtsam ehk arusaadavam arvuti jaoks. Kui tegu on näiteks (üli)lühikeste lausetega, võib arvutisüsteem segadusse sattuda,” lisab Siiri Pärkson.
Ülaltoodud tulemused viitavad omakorda inimese võimele arvutisüsteemi ja ka simuleeritud tehissüsteemi seatud piirangutega kiiresti kohaneda. Pärkson toob näite: “Klient, kes tungivalt infot vajab, võib oma kõnevoore seni modifitseerida, kuni soovitud info kätte saab.” Selline kohastumine masinaga on küll märk suurepärasest võimekusest, ent see ei aita kaasa loomuliku ehk tavapärase sundimatu suhtlemise arendamise ideele dialoogsüsteemiga. “Kohanemine ei olnud siiski täielik. Üks oluline erand väljendus selles, et kasutajad ei kohanenud simuleeritud arvutisüsteemi aeglusega,” osundab Pärkson.
Dialoogsüsteem Spark tunneb emotikone ehk emotsioonide väljendamiseks mõeldud kirjamärkidest koostatud piltmärke, annab juhiseid vigase teksti korrigeerimiseks ja oskab suhelda mitmesugustel Eestiga seotud teemadedel.
Arvuti sotsialiseerib välismaalast
Doktoriväitekirjas pakutakse välja mitmeid intrigeerivaid ideid dialoogsüsteemide edasiseks arendamiseks ja süsteemide kasutamist mõjutavate tegurite uurimiseks. Kuigi Siiri Pärkson teeb mõningaid tähelepanekuid kasutajate kommentaaride põhjal dialoogsüsteemi avatari kuvandile, ilmele ja liigutustele (kui tegu on animeeritud tegelasega), kavatseb ta küsimusele, mil määral ja kuidas mõjutab süsteemi liidese välimus kasutaja suhtlemist, eeskätt valitud suhtlusstiili ja hoiakuid süsteemi suhtes, keskenduda edaspidises uurimistöös.
Lisaks on tal kavas lähemalt analüüsida käitumisest tulenevat vastastikmõju, see tähendab, kuidas dialoogsüsteemi käitumine (peamiselt n-ö keelelise käitumine ja sealhulgas vaikimine või kõnevooru ignoreerimine) mõjutab süsteemi kasutaja käitumist. Saadav teave aitaks süsteemil oodatavate suhtluseesmärkide täitmisega oskuslikumalt toime tulla ja parandaks kokkuvõttes dialoogi kvaliteeti.
Viimasel ajal on Siiri Pärksonil ja tema juhendatavatel bakalaureuseõppe tudengitel käsil uue keeleõppesüsteemi täiustamine. Juturobot Spark otsib kasutajate sisestatud tekstist tuttavaid märksõnu ja vastab neile ettekirjutatud reeglite põhjal, mida praeguseks on sisestatud juba üle 290. Samuti oskab ta – esialgu vaid kirjalikult – suhelda ka mitmesugustel Eestiga seotud teemadel, milleks on geograafia ja demograafilised näitajad, pühad ja tähtpäevad, sümbolid ja ajalugu ning tuntud eestlased. Seda kõike selleks, et eesti keele õppijale ka kultuurilist ja ühiskondlikku konteksti tutvustada.
Näiteks võib Spargilt küsida, millised on Eesti rahvusvärvid või hümn ning süsteem juhatab riigikantselei veebilehelt kenasti kätte kaitseväe orkestri ja rahvusmeeskoori esituses kõlava “Mu isamaa, mu õnn ja rõõm”. Keeleõppe rakendusena keskendub Spark õigekirjale ja annab juhiseid vigase teksti korrigeerimiseks ja viitab elektroonilisele keelenõuande lehele, kus konkreetsest probleemist ja reeglitest on pikemalt kirjutatud. Tulevikus võiks Spark anda keerulisemate sõnade ja terminite kohta täpsemaid seletusi ning tõlkevasteid.
Praeguses etapis ei ole Spark veel valmis suuliseks infovahetuseks. Siinkohal on esialgu takistuseks võõrapärane aktsent, millega esitatud küsimusi Spark mõista ei suuda, ammugi siis adekvaatselt vastata. Samas teeb süsteem edusamme slängi, emotikonide ja muude netikeelele iseloomulike nähtuste omandamisel. Kuid et Spargi ülesanne on siiski korrektset keelt õpetada, ei ole tal lubatud slängi ja emotikone vestluses kasutada, kuigi ta nende tähendusest aru saab.
Keele- ja kultuuriõppesüsteemide loomine on Siiri Pärksoni sõnul aktuaalne kasvõi ulatusliku rände kontekstis, kus nutikad lahendused välismaalaste integreerimisel ja sihtriigi elukorraldusega kohanemisel väga vajalikuks osutuvad. Mõistagi ei piisa sel juhul ainult monokeelsetest süsteemidest. Samuti oleks tervitatav dialoogsüsteemide laialdasem rakendamine ühiskondlikke teenuseid pakkuvate asutuste veebilehtedel, kus kõiksugu e- ja i-teenuste iseseisva kasutamise kõrval aitaks kodanikul infoküllases keskkonnas kiiresti orienteeruda ka intelligentne robot-assistent.
Animatsioon Siiri Pärksonist ilmestab tema doktoriväitekirjas käsitletud suhtlusprobleeme inimese ja arvuti vahelistes ning inimeste-vahelistes dialoogides. (Fotod: Allar Mehik)
Siiri Pärkson kaitseb 29. märtsil doktoriväitekirja “Dialoogist dialoogsüsteemini: partneri algatatud parandused”, mis on valminud professorite Renate Pajusalu ja Mare Koidu juhendamisel. Oponeerivad Anne Tamm Kesk-Euroopa ülikoolist ja Hille Pajupuu eesti keele instituudist.
Toimetaja: Katre Tatrik, Tartu ülikool