TTÜ professori 3 soovitust, kuidas panna robotid kiiremini eesti keelt rääkima
Teksti ja kõnet mõistvad robotid tõotavad teha inimeste elu kergemaks mitmes eluvaldkonnas. Tallinna tehnikaülikooli tarkvarateaduse instituudi sotsiotehniliste süsteemide laboratooriumi professor Kuldar Taveter pakub nüüd kolm lahendust, kuidas kiirendada eesti keelt mõistvate robotite kasutuselevõttu.
Üheks tehisintellekti laialdasemaks kasutuskohaks on kujunenud virtuaalassistendid (ing k chatbots). Virtuaalassistent põhineb autonoomsete tarkvaraagentide teoorial ja rakendustel, millega tegelen oma uurimistöös ka mina. Tuntuimateks virtuaalassistentideks on näiteks Apple’i Siri, Google’i Now ja Microsofti Cortana.
Virtuaalassistendi keskmes on loomuliku keele töötlemise moodul, mis kas “loeb” inimese saadetud vestlusteksti või tõlgendab inimese poolt räägitud juttu. Selleks kasutatakse keerulisi algoritme, mis kõigepealt püüavad aru saada, mida inimene ütles, seejärel püüavad järeldada, mida ta tegelikult mõtles ja mida ta soovib ning lõpuks genereerivad virtuaalassistendi teadmiste baasis leiduva info põhjal sobivad vastused.
Virtuaalassistendid ei "kõnele" sugugi ainult inglise keelt. Näiteks KLMi virtuaalassistent, mis töötab Facebooki Messengeris, annab teavet lennuvõimaluste ja lendude kohta mitmetes eri keeltes. Hiinas kasutatav sotsiaalmeedia platvorm WeChat aga pakub hiinakeelseid virtuaalassistente. Ka eestikeelsete virtuaalassistentide loomine ei ole mingi ületamatu probleem ja minu kolleegi sõnul on paar-kolm niisugust virtuaalassistenti Eestis juba kasutusel.
Eestikeelseid virtuaalassistente oleks väga vaja näiteks Eesti avalikus sektoris proaktiivsete ja automatiseeritud e-teenuste pakkumisel lähtudes kodaniku, firma või MTÜ elusündmustest ja profiilist. Virtuaalassistentide juures ja laiemalt tehisintellekti puhul on pudelikaelaks just loomuliku keele tõlgendamine, sest iga tehisintellekti süsteem, mis püüab inimkeelest aru saada, peab rinda pistma ka niisuguste nähtustega nagu metafoorid ja võrdluspildid.
Üheks võimaluseks saada kiiremini häid tulemusi loomuliku keele töötlemisel on piirata virtuaalassistendi poolt kasutatav loomulik keel ära mingi probleemvaldkonnaga. Sel viisil saame niinimetatud kontrollitud keele töötlemise oskusega virtuaalassistendi. Taoline virtuaalassistent võib näiteks reisiteeninduse valdkonnas suhelda kasutajaga nii, et viimane ei saa arugi, et räägib virtuaalassistendiga, aga jääb kohe hätta kui talt küsida midagi ootamatut – näiteks tänase ilma kohta.
Teiseks võimaluseks kiirendada eestikeelsete virtuaalassistentide laiemat saabumist on ära kasutada Eesti Wordneti võimalusi. See on eestikeelne andmebaas, mis seob eesti keeles esinevad mõisted omavahel erinevate semantiliste suhetega nagu näiteks ülem- ja alammõiste, osa-terviku suhe, vastandi suhe, rollisuhe jm. Maailmas ei ole just väga palju keeli, millede jaoks on loodud terviklik WordNeti tesaurus, mistõttu seda võimalust tuleks kindlasti paremini ära kasutada.
Kolmandaks tuleks paremini rakendada Eesti teadlaste poolt juba praegu pakutavaid tulemusi. Näiteks tegeletakse Tallinna Tehnikaülikooli tarkvarateaduse instituudis eestikeelse kõne analüüsiga, kõne- ja kõnelejatuvastusega ning kõnesünteesiga, mis kõik on vajalikud tehnoloogiad ka eestikeelsete virtuaalassistentide loomisel.
Toimetaja: Jaan-Juhan Oidermaa