Eestlased võivad kõnetehnoloogia arenedes anduda inglise keelele

Google Nesti nutikõlarid paisati turule juba 2016. aasta lõpus. Nutikõlaritega ühes on seadmes ka häälassistent, kellelt näiteks paremaid Spotify laulusoovitusi või Netflixi filmisoovitusi küsida. Eestikeelne tugi seadmel praegu puudub.
Google Nesti nutikõlarid paisati turule juba 2016. aasta lõpus. Nutikõlaritega ühes on seadmes ka häälassistent, kellelt näiteks paremaid Spotify laulusoovitusi või Netflixi filmisoovitusi küsida. Eestikeelne tugi seadmel praegu puudub. Autor/allikas: BENCE BOROS/Unsplash

Tuleviku nutiprillid muundavad välismaise vestluskaaslase jutu murdosa sekunditega emakeelseteks subtiitriteks. Nutikõrvaklapid aga toovad kuulajani automaatse sünkroontõlke. Ometigi võib kõnetehnoloogia areng teha eesti keelele karuteene, juhul, kui eestikeelsete lahenduste kvaliteet ingliskeelsetega sammu ei suuda pidada, ütlesid keeletehnoloogid.

Kui tänasel päeval minna välismaale puhkusele kohalikku keelt rääkimata, pole see enam probleem. Võimalik on kõneleda oma nutitelefoni, mis seejärel selle teksti automaatselt ära tõlgib ning ettegi loeb.

Tõlge pole, tõsi, siiski veel vigadeta. Eriti, kui tõlkida mõnest väikeriigi keelest, nagu seda on eesti keel. Ühtlasi on nutiseade meist veel võrdlemisi eraldiseisev. Me hoiame nutitelefoni käes, räägime selle sisse, piidleme, kas telefon sai meist ikka õigesti aru, vajadusel parandame, ning seejärel ootame vastust. Ning nii iga lause järel.

Tulevikus kaob selline pinev ekraani vaatamine ning tõlke ootamine ära. Tallinna Ülikooli digitehnoloogia instituudi doktorant ja nooremteadur Kais Allkivi-Metsoja sõnas, et lähikümnenditel piir inimeste ja masinate vahel järk-järgult hägustub. Laiemasse kasutusse jõuavad mitmesugused kehal kantavad seadmed ning tehnoloogia kolib pihust prillidesse ja kõrvaklappidesse.

Ta ütles, et masintõlge on tänu tehisnärvivõrkudele teinud mõne viimase aastaga suure arenguhüppe. Samuti arendatakse kõneleja häält jäljendavaid kõnesünteesi rakendusi ja suuliigutusi matkivaid arvutimudeleid.

"Suure tõenäosusega saame siis omavahel vestelda ilma arugi saamata, et kõneleme eri keeli. Kaaslase jutt kostub, nagu räägiks ta meie keeles – ja seda omaenda häälega. Isegi tema suu liigub vastavalt," ütles Allkivi-Metsoja.

Kais Allkivi-Metsoja kuulub 52 riigi teadlasi koondavasse võrgustikku "Keel inimmasina ajastul" ("Language in the Human-machine era"), mis uurib uute ja alles esilekerkivate tehnoloogiate mõju keeltele ja ühiskonnale. Maikuu lõpus ilmus võrgustikult ka uus raport. mis annab populaarteadusliku ülevaate keeletehnoloogia hetkeseisust ning tõenäolistest tulevikusuundadest.

Allkivi-Metsoja selgitas, et keeletehnoloogias on tuleviku muusikaks liitreaalsus, kus tegelikku keskkonda täiendab virtuaalne sisu. "Nutiprillid võimaldavad silme ees näha näiteks kaardirakenduse juhiseid. Sarnaselt on võimalik kuvada silme ette ka näiteks masintõlget," ütles ta.

Keeleuurija sõnul on tulemas kaks suuremat muutust. Esiteks see, et tehnoloogia vahendab, tõlgib ja toimetab reaalajas keelt. Nii seda, mida me kõneleme ja kirjutame, kui ka seda, mida me kuuleme ja loeme.  Teisalt aga on tehnoloogia ise aina enam meie vestluspartneri rollis.

Masinatega kõnelemine on mingil määral võimalik juba tänapäeval, näiteks telefonis pesitseva virtuaalse assistendiga rääkides. Tulevikus muudab virtuaalreaalsus aga väga tõenäoliseks selle, et saame juttu ajada vestlusrobotitega, kellele on antud inimese välimus.

See võib kasulik olla näiteks keeleõppes võõrkeelse suhtluse harjutamiseks. "Vestlusrobot imiteerib näiteks itaallast, juhul, kui me õpime itaalia keelt, ja virtuaalreaalsus võimaldab luua meie ümber ka keskkonna, mis meenutaks meile Milanot või Roomat," selgitas Allkivi-Metsoja.

Ta ütles, et kõneroboteid kasutatakse tulevikus tõenäoliselt ka lihtsalt ajaveetmiseks. "Robotitest võivad tinglikult saada meie sõbrad, kes löövad näiteks kaasa vestlustes, kus osalevad nii inimesed kui ka robotid. See kõik tähendab, et tulevikus on väga keeruline eristada sellist kõne ja kirjalikku teksti, mis on inimese loodud, ja kõnet-teksti, mille loomises on osalenud arvuti," ütles ta.

Virtuaalreaalsus võimaldab tulevikus rännata kas või Milanosse, kus inimese välimusega virtuaalassistent itaalia keelt õpetaks, selgitas Allkivi-Metsoja. Autor/allikas: stem.T4L/Unsplash

Kas usaldame arvutile enda eest rääkimise?

Seda, et kõnetehnoloogia arenedes võõrkeelte õppimise vajadus täielikult möödanikku vajuks, keeleteadlased ei arva.

Londonis paikneva Imperial College'i masinõppe õppejõud Marek Rei ütles, et otsene vajadus tulevikus võõrkeeli õppida kaob paljudel tõesti ära ning hakkama saab ka eesti keelega. Nii näiteks saab välismaale reisida inglise keelt oskamata.

See aga ei tähenda, et keelte õppimine ei oleks mõistlik. Häid põhjuseid keelte õppimiseks leiab Rei sõnul kindlasti. "Kui lähed näiteks välismaale ja tahad sealt endale partnerit leida, siis ei saa sa elu lõpuni jääda temaga Google Translate'i kaudu suhtlema," ütles ta.

Seda, et tulevikus enam võõrkeelte õppimisel mõtet ei oleks, ei arva ka Kais Allkivi-Metsoja. Küll aga võivad tema sõnul muutuda põhjused, miks keeli õpitakse. "See võib muutuda rohkem ajutreenimise hobiks, sest keelte õppimine arendab ju meie kognitiivset võimekust,"  sõnas ta.

Lõppkokkuvõttes taandub kõik sellele, kuivõrd me tehnoloogia saadud tõlget usaldame. "Praegu on kindlasti mõtet võõrkeeli õppida ja neid on mõtet õppida alati, sest see, kuidas inimene keelt kasutab, on ju ikkagi teistmoodi kui see, kuidas arvuti keelt genereerib. Kas me tahame anda siis kogu keeleloome üle arvutitele? Tõenäoliselt mitte," ütles Allkivi-Metsoja.

Võõramaised seadmed eesti keelt ei mõista

Siri virtuaalassistent ilmus iPhone 4S telefonile 2011. aastal ning on praegu olemas 21 keeles. Väiksematest keeltest on Siri norra, soome ja taani keeles. Autor/allikas: Omid Armin/Unsplash

Väiksematesse keeltesse, nagu näiteks eesti keelde, jõuab tehnoloogia tavaliselt korraliku viitega. Google'i ja Amazoni virtuaalsed assistendid, mis võimaldavad inimestel häälkäskluste abil nutiseadmetega kõneleda, ilmusid inglise keeles turule juba enam kui viis aastat tagasi. Eesti keeles neid rakendusi praegu aga veel ei ole.

Ka kümme aastat tagasi turule tulnud Apple'i virtuaalsel assistendil Siril puudub praegu eestikeelne tugi ning see on saadaval vaid umbes paarikümnes keeles.

Kais Allkivi-Metsoja ütles, et kuigi eesti keel ei ole tehnoloogise toe poolest üldse halvas seisus, kujutab selline mahajäämus keelele siiski ohtu. "On oht, et kui tehnoloogiad on eesti keeles kehvemini kasutatavad, siis hakatakse aina enam tarvitama ja eelistama nende inglisekeelset kasutajaliidest. Siis hakkab eesti keele kasutusvaldkond vaikselt kokku kuivama, sest on mingisugused seigad meie igapäevaelus, kus me väldime oma emakeele kasutamist," ütles ta.

Ka Tallinna Tehnikaülikooli Tarkvarateaduse instituudi vanemteadur Tanel Alumäe oli sarnasel meelel. Kuigi pikas plaanis on võimalus, et eestlased ei pea keeletehnoloogia arenedes võõrkeeli üldse õppimagi, Alumäe seda ei uskunud. "Pigem usun ma, et need nutiseadmed ja inglise keele pealetung tähendavad siiski teatud ohtu eesti keelele," ütles ta.

Ta tõi välja, et suurte välismaiste ettevõtete, nagu näiteks Google'i või Amazoni, rakenduste probleem on see, et nende süsteemid on kinnised. "Isegi, kui meil oleks väga hea eesti kõnetehnoloogia ja meil oleks inimesed, kes on kompetentsed, siis meil puudub võimalus sellistesse seadmetesse eesti keele tuge lisada," ütles ta. Ta lausus, et praegu saab seda tavaliselt teha vaid seadme tootja. 

Keeletehnoloog ütles, et võimalik lahendus oleks ehk seadusandlik. Seadmetel ei pea küll olema eesti keele tugi, aga kolmandatel osapooltel, nagu näiteks teadlastel, peab olema võimalus see tugi lisada. "Praegu me võime metsikult arendada seda eesti keele tehnoloogiat, aga seda sinna nutikõlarisse panna ei saa. Me ei saa arendada ka eesti keelset nutikõlarit, sest see nõuaks sadades miljonites investeeringuid ja sadu teadlasi," ütles ta.

Marek Rei oli optimistlikum ning lausus, et kuigi praegu võivad ingliskeelsed rakendused eestikeelsetest viis või kümme aastat ees olla, siis see vahemaa tulevikus tõenäoliselt väheneb. "Me oleme ingliskeelega jõudnud sellisesse staadiumisse, kus süsteemid toimivad juba päris hästi. Nüüd töötab üpris suur kogukond selles valdkonnas juba selle kallal, kuidas neid süsteeme laiendada ka teistele keeltele, kus ei ole nii palju andmeid," ütles ta.

Üha rohkem hakkab Rei sõnul tulema rakendusi, mis ei ole konkreetselt eesti keele jaoks, vaid mis toetavadki väga paljusid erinevaid keeli.

TTÜ kõnetuvastus trumpab välismaised konkurendid üle

Rei tõi välja, et selleks, et me tulevikus välismaise külmikuga vahetult ja tõhusalt kõneleda saaksime, on vaja põhimõtteliselt kaht asja. Ühelt poolt on vaja head eesti keele kõnetuvastust, mis meie emakeelse kõne tekstiks muudaks. Teisalt on vaja head eesti-inglise tõlget.

"Kui need jupid on ära lahendatud ja süsteemi sisse integreeritud, siis ma ei näe erilist probleemi, et miks mitte ka külmikuga tulevikus eesti keeles kõneleda," ütles ta.

Selleks, et külmik meile vastu kõneleks on aga vastupidi vaja head inglise-eesti tõlget ning kõnesünteesi, mis eestikeelse teksti ehedaks kõneks muudaks.

Eestikeelset kõnesünteesi arendavad Eestis välja nii Eesti Keele Instituut kui ka Tartu Ülikool. Välismaal tegelevad sellega veel näiteks Google ja Microsoft.

 

 

Rei toob välja, et peamine piirang eestikeelsete süsteemide loomisel ongi eestikeelsete andmete vähesus. Inglise keele jaoks on tihti andmed olemas, eesti keele jaoks aga mitte.

Kõige lihtsam lahendus olekski andmeid lihtsalt massiliselt eesti keelde tõlkida. "Kuna masintõlge on juba päris hea, siis me saame võtta mingi andmekogu, selle masintõlkesüsteemist läbi lasta ja eesti keelde panna. Siis treenime mudeli selle peal," ütles ta.

Eestikeelset kõnetuvastust arendab lisaks Google'ile ja Microsoftile ka Tanel Alumäe juhitud töörühm Tallinna Tehnikaülikoolis. Lisaks arvutite ja seadmetega suhtlemisele võimaldab kõnetuvastus ka näiteks dikteerida dokumente või transkribeerida kõne- ja videosalvestusi.

Alumäe sõnul arenevad maailma kõnetuvastusprogrammid kümne aasta jooksul tõenäoliselt nii kaugele, et nendega võib juba teha ka koosolekute protokolle. "See on minu jaoks kui püha graal kõnetehnoloogias. Koosolekuid on palju, need on tüütud ja keegi peab need protokollid tegema. Kui meil oleks selline masin, mis neid protokolle hästi ja kvaliteetselt teeks, siis see hoiaks ikka väga palju aega kokku," ütles ta. Alumäe sõnas, et selle tehnoloogia välja töötamisega maailmas juba aktiivselt töötatakse.

Seda, kaua läheb aega, et tehnikaülikooli kõnetuvastus spontaansest kõnest juba raskusteta aru saaks, on Alumäe sõnul keeruline öelda. "Kui me kümme aastat tagasi ootasime seda, et kõnetuvastus jõuaks sinna, et see suudaks raadiosaateid või riigikogus ette kantud kõnet suhteliselt hästi transkribeerida, siis täna tahame ka seda, et see suudaks spontaanset kõne kirja panna. Selle tuvastamine on palju vigaderohkem," ütles ta.

Ta lausus, et probleem on see, et mida paremaks kõnetuvastus läheb, seda rohkem on selle edasiseks kvaliteedi parandamiseks vaja ka treeningandmeid. Treeningandmetes on kõne ja siis sellele vastav inimese kirja pandud tekst ilma vigadeta. Selliste andmete tootmine on aga kallis ja ajamahukas.

 "Selleks, et kõnetuvastuse kvaliteet paraneks kümme protsenti ehk vigu läheks kümme protsenti vähemaks, selleks on meil vaja kümme korda rohkem andmeid," ütles ta. Praegu kasutavad TTÜ teadlased eesti keele jaoks umbes 700 tundi treeningmaterjali. 

Alumäe ütles, et viimastel aastatel on tehtud suuri läbimurdeid selles osas, kuidas ära kasutada teiste keelte transkribeeritud kõnet, selleks, et luua väheste treeningressurssidega keeltele kõnetuvastusmudeleid. See tähendab, et kui masin oskab juba näiteks hiina või hispaania keelt, siis oleks talle ka ka lihtsam eesti keelt õpetada.

Alumäe tõi välja, et tänu sügavatele närvivõrkudele ja arvutusvõimsuse kasvule on viimastel aastatel kõnetuvastusprogrammide areng olnud ülikiire.

Novaator proovis omal käel, kuivõrd täpne TTÜ kõnetuvastusprogramm on ning luges programmile rahulikul kiirusel ette esimesed neli lõiku Anton Hansen Tammsaare "Tõest ja õigusest". Programm eksis vaid üksikute sõnadega, kirjutades näiteks "lömitas" asemel "Lümitas" ning "kolmekümnelist" asemel "kolme kümnelist". Kõnetuvastus jäi hätta ka kirjavahemärkidega, suure ja väikese algustähega, ega suutnud teksti erinevateks lõikudeks jagada.

Keel võib tehnoloogia tõttu vaesuda

Kais Allkivi-Metsoja tõi välja, et arengud keeletehnoloogias hakkavad peale keele kasutamise mõjutama ka keele struktuuri. Ta möönis, et juba praegu avaldab keelekasutusele mõju see, et suur osa tekste, millega inimesed kokku puutuvad, on vähemalt osaliselt arvuti loodud.

Ta selgitas, et arvutite kasutatavad keelemudelid prognoosivad statistika alusel, milline sõna peaks eelnevale kõige tõenäolisemalt järgnema. Nii hakkavad sagedaimad keelemustrid masintõlkes ja tekstikorrektorite antud soovitustes üha korduma.

"Olen Google'i rakendustes ingliskeelset teksti kirjutades avastanud, et kui jään korraks mõttesse, pakub rakendus hallis kirjas välja, millise sõnaga võiksin lauset jätkata. Mind on mõned korrad see lausa häirinud. Võib-olla ma tahtsingi just seda sõna kasutada, kuid mõttega, et masin juba teab, mida öelda tahan, pole lihtne harjuda," kirjeldab Allkivi-Metsoja isiklikku kogemust.

 

"Mõned korrad olen ka need hallis kirjas kirjutatud pakutud soovitused vastu võtnud ja siis järele mõelnud, et kui paljud inimesed seda juba teevad, siis hakkab see lõpuks tegelikult ju taastootma ühesuguseid keelekasutuse mustreid," lausus ta.

See tähendab, et need sõnad ja väljendid, mis on keeles kõige sagedasemad, võivad muutuda veelgi sagedasemateks. Kui keeleõppes ja avalikus kommunikatsioonis tasubki lihtsamaid ja sagedamaid väljendeid eelistada, siis üldiselt teeb selline keelekasutuse ühtlustumine keelele pigem karuteene, ütles Allkivi-Metsoja.

"Tulemuseks võivad olla väga ühetaolised tekstid, just nagu valemite järgi loodud poplaulud, mida on raske üksteisest eristada," nentis ta. Ta lisas, et sellistele mõjudele tuleb tähelepanu pöörata pigem vara kui hilja.

Hea lugeja, näeme et kasutate vanemat brauseri versiooni või vähelevinud brauserit.

Parema ja terviklikuma kasutajakogemuse tagamiseks soovitame alla laadida uusim versioon mõnest meie toetatud brauserist: