Tulevik – kui külmkapp ei räägi kasutajaga eesti keeles, sureb keel välja
„Kaks-sada. Meetri. Pärast. Pööra paremale.“ Kas selline „nurgeline“ eestikeelne lause tuleb tuttav ette mõnest auto GPS-seadmest? Tulevik on selle päralt, et värkvõrk ehk lihtsalt öeldes meie igapäevakasutuses olevad nutikad tehnikavahendid suhtlevad meiega eesti keeles. Loodetavasti vähem „nurgelises“ keeles kui praegu.
„Kui praegusel digiajastul pole keelel keeletehnoloogilist tuge, siis ta sureb välja,“ ütleb Tartu Ülikooli keeletehnoloogia teadur Kadri Vider Eesti Keeleressursside Keskusest. Kadri Vider on juhtkomitee liige riiklikus programmis „Eesti keeletehnoloogia 2011-2017“ (EKT). See programm toetab keeletehnoloogia-alast teadus- ja arendustegevust, millega luuakse digitaalseid keelevarasid ja töötatakse välja keeletehnoloogia rakendusi, mis meie igapäevategevusi hõlbustavad ning ühes sellega aitavad digiajastul eesti keelt elus hoida.
Kadri Vider toob näiteks selle, kuidas meie igapäevaseadmed ja ümbritsev kodutehnika kasutajaga suhtleb. Võtame külmkapi, mis oskab analüüsida, milline toit parasjagu otsa on saanud ning annab omanikule soovituse seda juurde osta.
Tõsi, selle taga on väga palju rohkem keerulist tehnoloogiat kui ainult kõnetuvastus ja süntees – seade peab oskama pakendikoodide alusel tuvastada, analüüsida ja oma järeldused teha ning alles seejärel sõnastada see loomulikus keeles vastuseks ja kõneks.
Ja oleks ju tore, kui see suhtlus toimuks kaunis eesti keeles, mitte „nurgelises“ „Piim. Olema. Otsas. Ostma. Juurde. Palun“.
„Selle vajalikkuse üle võib muidugi filosofeerida – kuhu inimtunnetus jõuab, kui masinad nendega loomulikus keeles ja arusaadavalt suhtlevad,“ märgib Kadri Vider. Samas on selge, et digiajastul on keele säilimise seisukohast oluline just taolise keeletehnoloogia arendamine.
Või võtame näiteks ajakirjanikud. Igal ajakirjanikul, kes on salvestanud tunnise intervjuu ning kel seisab ees rohkem kui tund helifaili ümberkirjutamist, käib korraks peast läbi mõte, kas ikka veel ei ole head kõnetuvastustehnoloogiat, mis ümberkirjutamise tööd hõlbustaks? Tuleb välja, et tehnoloogia on, kuigi tulemus ei pruugi veel olla päris ootuspärane.
Kadri Vider räägib, et selline tehnoloogia on olemas ja isegi nutitelefoni rakendusena saadaval. Ainus häda on, et eesti keele tuvastamiseks peab tekst olema kõneldud rahulikult, ilma mürataustata keskkonnas ning nii, et inimesed ei räägi korraga.
Ajakirjanikku see niisiis veel iga intervjuu transkribeerimisel aidata ei saa.
Väljakutse on arendada kõnetuvastustehnoloogiat nii, et tuvastada oleks võimalik konkreetset inimkeelt, olenemata sellest, kas räägib mees või naine, noor või vana, üksi või mitmekesi koos. Kuigi kõnetuvastusel võivad takistuseks osutuda eelmainitud asjaolud, siis takistuseks võib saada ka püüdlikult korralik kõne.
Kadri Vider toob näiteks Columbia ülikoolis juba 1990. aastatel kõnetuvastuse uuringuid teinud Julia Hirschbergi, kes tegeles inglise keele kõnetuvastusega dialoogisüsteemides. Uuriti, kuidas püüavad Kesk-Lääne emotsionaalsed naisterahvad tellida lennukipiletit kõnetuvastussüsteemiga varustatud tellimiskeskkonnas.
Juhtus aga nii, et need Kesk-Lääne aktsendiga inglise keelt emakeelena kõnelevad naised (native speakers) hakkasid rääkima ebaloomulikult aeglaselt ja selgelt. „Kui inimesel on vastas masin, siis mõtleb inimene, et masinaga tuleb rääkida hästi aeglaselt. Aga masin pole treenitud aeglase ja selge kõne jaoks,“ märgib Vider.
Kõnetuvastustehnoloogia testimiseks pidavat Videri sõnul kõige rohkem kasutatama ülikooli 2. kursuse mitte-emakeelsed meestudengid. Nii on võimalik proovile panna tehnoloogiat mitmetähendusliku loomuliku kõnega. See viimane on põhjus, miks kipuvad keeletehnoloogilised komponendid keerulisemates situatsioonides tegema vigu.
Kõnetuvastuse vigu saab vähendada keerulisemate algoritmide ja suuremate andmestike kasutuselevõtuga. Kõnetuvastusmudelid töötavad keskmistatud andmete põhjal ehk kõnetuvastus tahaks kõigist aru saada. Ka Kesk-Lääne emotsionaalsetest naistest või miks mitte omapärase tooniga eesti keelt kõnelevatest saarlastest.
Tegelikult on EKT programmi raames tegeletud väga erinevate keeletehnoloogiliste projektidega, mis pikas perspektiivis eesti keele hoidmist toetavad. Näiteks on ETV-s kasutusel subtiitrite kõnesünteesi abil helindamise süsteem, mis muudab subtiitrid audiotekstiks, et telesisust saaksid osa ka vaegnägijad.
Või näiteks kõnetuvastuse brauser, mis muudab tekstiks raadiosaateid. Tekstid ilmuvad veebi küll paaritunnise viivitusega, sest kõnesignaali analüüs TTÜ Küberneetika Instituudi kõnetuvastuse serveris võtab umbes kaks korda nii palju aega kui selle kõlamine eetris. Sellest rääkis ka küberneetika instituudi foneetika ja kõnetehnoloogia labori vanemteadur Tanel Alumäe Kuku raadio saates “Kukkuv õun”.
EKT programmi kahes uurimisprojektis on tegeletud ka meditsiinitekstide korpustega ehk tekstiandmete kogumitega. Üks projekt tegeleb arstide saatelehtedele kirjutatud diagnooside tuvastamisega ning võimaluste otsimisega, kuidas seda saaks paremini e-tervise projekti raames rakendada.
Teine uurimisprojekt on seotud radioloogiaga. Radioloogid kirjeldavad röntgenpilti vaadates võimalikku haigusseisundit. Praegu tehakse selle põhjal märkmed, kuid oluliselt tõhusam oleks kasutada kohe reaalajas kõnetuvastust ehk saada kirja sisulisemalt, kiiremini ja vähese vaevaga rohkem olulist informatsiooni.
Kogutud on hulk radioloogide salvestisi ja treenitud kõnetuvastuse süsteemi salvestiste peal. Oluline on see, et tuvastatud kõne vaataksid üle ka erialaspetsialistid, et avastada võimalikke valesti tuvastatud sõnu.
EKT programm pöörab palju tähelepanu keeletehnoloogilise tuumiktehnoloogia kättesaadavaks tegemisele tarkvara-arendajatele, et eesti keeletehnoloogia oleks hõlpsasti kasutatav mitmesugustes süsteemides ilma põhjalike lingvistiliste teadmiste vajaduseta. Rõhutada tuleb ka seda, et riigieelarvest rahastatava EKT programmi tulemused ehk loodud keeleressursid ja -tarkvara on mõeldud kasutamiseks võimalikult vabalt (open data, open source) ja liigsete juriidiliste piiranguteta, sealhulgas kommertseesmärkidel, kõigile soovijatele nii Eestis kui välismaal. See on maailma mastaabis suhteliselt enneolematu.
Kadri Videri sõnul lätlastel ja soomlastel sellist riiklikku keeletehnoloogia programmi ei ole, kuid nende turud on suuremad ning teatud osas on soomlaste kõnesünteesi võimekus natuke parem. Lätlastel on tugev tõlkesüsteemide arendamisele keskendunud ettevõte Tilde, millel on ka tütarfirmad Eestis ja Leedus.
Keeletehnoloogia taseme võrdlemisel on võtmesõna aga vormianalüüs, mis eestlastel on parem kui lätlastel, soomlastel on eestlastega enam-vähem samal tasemel. Lõpuks viib just see kuhu ja kui käegakatsutavatesse rakendustesse keeletehnoloogia lõimitud on ehk lihtsalt öeldes, kui käegakatsutavas kauguses on näiteks eesti keeles kasutajaga suhtlev külmkapp.