Tehisintellekt kirjutas e-etteütlust. Vaata, kuidas ta hakkama sai

Tallinna Tehnikaülikooli tehisintellekt küll selline välja ei näe, aga e-etteütlust ta siiski kirjutas.
Tallinna Tehnikaülikooli tehisintellekt küll selline välja ei näe, aga e-etteütlust ta siiski kirjutas. Autor/allikas: Franck V. /Unsplash /Creative Commons

Tallinna Tehnikaülikooli kõnetuvastus teeb kõnest teksti ning ERR Novaator koos Vikerraadioga pani ta kirjutama tänavust e-etteütlust. Kuidas masinõppetehnoloogial põhinev tehisintellekt ülesandega hakkama sai ning miks tulemus just niisugune oli, selgitas tehnikaülikooli vanemteadur Tanel Alumäe, kes on ka üks selle tehnoloogia loojatest.

Tallinna Tehnikaülikooli veebipõhisesse kõnetuvastuse keskkonda on võimalik üles laadida .mp3 formaadis helifail ning selle transkriptsioon saadetakse tagasi e-kirjana.   

Selline tuli Tallinna Tehnikaülikooli kõnetuvastuse tekst etteloetud e-etteütluse põhjal:

Aitäh, kaasmaalane et pärast mitmendat seitsmendat korda tõe ja õiguse vaatamist ärkselt e-etteütlust kirjutad tähistamaks riigikeele ning laulupeo juubelit. Laulu ja tantsupeole soovivad kõik, olgu nad nii-öelda euro aastal sündinud kooli uusikud, kes lauluväljakul veel hästi ei orienteeru. Või väliseesti tantsurühmad, kes Kalevi Keskstaadionil Tuljakut esitades ühe korraga kodumaa igatsust ja jällenägemise rõõmu tunnevad.

Kas üle-eestiline juubelipidu, minu arm kuulub Rahvusringhäälingu enim vaadatud saadete hulka on heinakuu alguseni teadmata.

Laula ja hõiska hüüab debütant dirigendipuldis, kui Gustav Ernesaksa likku segakoorilaulu juhatab. Ja enamus enamik* lauljaid, vaid ümiseb pilgud Laulutaadi mälestussambal.

Missugune on e-etteütluse õige tekst erinevate paralleelvormidega, saab kontrollida artikli lõpus olevast e-etteütluse tekstist.


ERR Novaator uuris Tanel Alumäelt, miks kõnetuvastus just niisuguseid vigu tegi.

Alustuseks on oluline teada, et Tallinna Tehnikaülikooli kõnetuvastustehnoloogiat võib lugeda kitsaks tehisintellektiks, mis põhineb masinõppel, täpsemalt närvivõrkude tehnoloogial. "Meie närvivõrgutehnoloogia on analüüsinud suurt kogust eestikeelset teksti, näiteks ajalehtedes ja veebis olevaid tekste. Nende põhjal on ta leidnud statistilised seaduspärasused, kus need sõnad tüüpiliselt esinevad, ja analüüsinud, kuidas kõneleja räägib," selgitas Alumäe.

Hüüumärgi panemiseks peab mõistma sisu

Eri kõnelemisviiside analüüs annab aimu, miks kõnetuvastus oskas küll panna sõnade vahele komasid, kuid mitte kõiki. Näiteks ei tundnud masin ära ütet (Aitäh, kaasmaalane, et pärast…). Alumäe selgitas, et kõnetuvastusel ei ole õigekirjareegleid kirjavahemärkide panemiseks.

Teatud sõnade puhul, mille ees kindlasti koma peab olema, oskab kõnetuvastus üldjuhul ka koma panna. Samuti oskab ta suurema tõenäosusega panna koma sinna, kus kõneleja teeb sõnade vahele pikema pausi.

Kirjavahemärkidest tuleb kõnetuvastus toime punkti, koma ja küsimärgiga. Viimast tuvastab ta enamasti lauses esineva küsisõna järgi, ehkki on ka lauseid, mille lõppu küsimärki ei tule ka siis, kui selles esineb küsisõna. Siis on kõnetuvastusel eksimisprotsent taas veidi suurem.  

Hüüumärki kõnetuvastus aga lisada ei oska, sest selle puhul on oluline mõista lause konteksti ja seda masin ei mõista. Ka e-etteütluse tekstis oli hüüumärgi puhul lubatud mitu võimalust: esimese lause lõpus võis olla hüüumärk, aga lubatud oli ka punkt.

Kõnetuvastuse kirjavahemärkide hulgas ei ole jutumärke, sest nendegi panemiseks tuleb teksti sisu mõista. Nii ei tundnud kõnetuvastus ära filmipealkirja "Tõde ja õigus" ega juubelipeo pealkirja "Minu arm". Kuid rahvatantsu "Tuljak" (või tuljak) puhul oli ta ära õppinud, et see on pealkiri ja kirjutas selle sõna suure algustähega.

Tehisintellekt arvutas välja, et meie avalikes tekstides esineb rohkem sõna Laulutaat kui laulutaat ja kirjutas seepärast selle sõna suure algustähega, mis on ühtlasi lubatud.

Kõnetuvastuse suurtähelembus

Suurtähti armastab kõnetuvastus panna ka sinna, kuhu keeleinimesed neid ei paneks. Näiteks sõna rahvusringhäälingu kirjutas kõnetuvastus suure tähega, kuid õige oli väiketäht. Alumäe ütles, et selle põhjus võib olla asjaolus, et kõnetuvastus on sõna ära õppinud meie avalikest tekstidest, kus sõna rahvusringhääling esineb organisatsiooni nimes Eesti Rahvusringhääling ja on seetõttu kirjutatud suurtähega.

Kuid lühendiga ERR oleks kõnetuvastus olnud ilmselt veelgi enam segaduses, sest topelttähe äratundmine sõnas on tema jaoks keeruline.

Gustav Ernesaksa likku

Sõnaga gustavernesaksalikku oli ilmselt kimpus nii mõnigi e-etteütluse kirjutaja. Tanel Alumäe nimetab niisuguseid spontaanselt loodud liitsõnu kõnetuvastuse jaoks eksootilisteks.

Eesti keel on aglutineeriv keel, mis tähendab, et uusi tüvesid ja sõnavorme justkui "kleebitakse" üksteise külge ning gustavernesaksalikku on üks näide niisugusest "külgekleepimisest".

Kõnetuvastuse keelekorpustes ei esine neid sõnu kuigi tihti, mistõttu ta seda sõna ka hästi ära ei tunne ja nii tundiski kõnetuvastus e-etteütluses ära sõnad Gustav ja Ernesaksa, kuid ei suutnud seda omadussõnaks kokku liita.

Alumäe sõnul on kõnetuvastuse jaoks palju suurem "pähkel" türgi keel, kus "külgekleepimise" teel võidakse saada 30-tähelisi sõnu, millega võib edasi anda kümmet erinevat tähendust.

Kui täpne on kõnetuvastus?

Tehnikaülikooli teadlased mõõdavad praegu kõnetuvastuse täpsust raadio vestlussaadete tekstide põhjal. Näiteks saate "Olukorrast riigis" tekstide põhjal on sõnavigade protsent üheksa. Raadiouudiste puhul on vigade protsent veel väiksem. Spontaanse kõne puhul on vigu jällegi rohkem, eriti kui kõne on salvestatud mürakeskkonnas, ruum kajab või on muid segavaid helisid. Siis võib vigu olla ka 20 protsenti või rohkem.

*Viimases lauses pidi etteütluse kirjutaja valima sõnade enamus ja enamik vahel. Kõnetuvastus kirjutas selle, mida kuulis ehk mõlemad sõnad.


E-etteütluse õige tekst koos parallelvariantidega:

Aitäh, kaasmaalane, et pärast mitmendat-setmendat korda "Tõe ja õiguse" vaatamist ärksalt e-etteütlust kirjutad, tähistamaks riigikeele ning laulupeo juubelit!

Laulu- ja tantsupeole soovivad kõik, olgu nad nii-öelda euroaastal sündinud kooliuusikud, kes lauluväljakul veel hästi ei orienteeru, või Välis-Eesti tantsurühmad, kes Kalevi keskstaadionil "Tuljakut" esitades ühekorraga kodumaaigatsust ja jällenägemise rõõmu tunnevad.

Kas üle-eestiline juubelipidu "Minu arm" kuulub rahvusringhäälingu enim vaadatud saadete hulka, on heinakuu alguseni teadmata.

"Laula ja hõiska!" hüüab debütant dirigendipuldis, kui gustavernesaksalikku segakoorilaulu juhatab ja enamus/enamik lauljaid vaid ümiseb, pilgud laulutaadi mälestussambal.

Viimases lauses tuleb valida kas enamus või enamik, õige on enamik.

Paralleelvõimalused:

1. Aitäh, kaasmaalane, et pärast mitmendat-setmendat korda "Tõe ja õiguse" vaatamist ärksalt e-etteütlust kirjutad, tähistamaks riigikeele ning laulupeo juubelit!

- lause lõpus punkt

- tähistamaks ees ei ole koma kohustuslik

2. Laulu- ja tantsupeole soovivad kõik, olgu nad nii-öelda euroaasta kooliuusikud, kes lauluväljakul veel hästi ei orienteeru, või Välis-Eesti tantsurühmad, kes Kalevi keskstaadionil "Tuljakut" esitades ühekorraga kodumaaigatsust ja jällenägemise rõõmu tunnevad.

- euro aasta

- väliseesti

- Lauluväljakul

- tuljakut

- kodumaa igatsust

- jälle nägemise

- "Kalevi"

3. Kas üle-eestiline juubelipidu "Minu arm" kuulub rahvusringhäälingu enim vaadatud saadete hulka, on heinakuu alguseni teadmata.

- üleeestiline

- Minu Arm

- enimvaadatud

4. "Laula ja hõiska!" hüüab debütant dirigendipuldis, kui gustavernesaksalikku segakoorilaulu juhatab ja enamik lauljaid vaid ümiseb, pilgud laulutaadi mälestussambal.

- gustav-ernesaksalikku

- segakoori laulu

- Laulutaadi

Toimetaja: Riina Eentalu

Hea lugeja, näeme et kasutate vanemat brauseri versiooni või vähelevinud brauserit.

Parema ja terviklikuma kasutajakogemuse tagamiseks soovitame alla laadida uusim versioon mõnest meie toetatud brauserist: