Kõnesüntees aitab eesti keele igavikku raiuda
Kõnesünteesi arendamisse viimase 15 aasta jooksul tehtud investeeringud hakkavad vaikselt vilja kandma, sest praeguseks suudavad masinad eesti keeles juba täitsa inimese moodi rääkida. Keeletehnoloogi sõnul suudavad pikas plaanis ellu jääda vaid omakeelse tehnoloogilise toega keeled.
Eesti Keele Instituudi keeletehnoloogia kompetentsikeskuse juht Kadri Vare rääkis Raadio 2 saates "Pulss", et kõnesünteesi on arendatud juba pikka aega, eesti keeles peaaegu 15 aastat.
Kõnesünteesiks nimetatakse inimkõne kunstlikku produtseerimist. Nii saab Eesti Keele Instituudi kõnesünteesi sisestada kirjaliku teksti ja vastav hääl loeb selle ette. Hääli saab valida nii mees-, nais- kui ka lapshäälte seast. Vare sõnul ei toimi kõnesüntees nõnda, et keegi salvestab linti kõik eestikeelsed sõnad või laused, vaid tegemist on tehnoloogiaga, mis treenib teatud hulga sõnade pealt kõnesünteesitehnoloogiat.
Rohkem teadust leiab kindlate häälikuüleminekute taga. Näiteks, kuidas hääldatakse mingisuguses kontekstis h-d või e-d. Kuna suured arvutivõimsused on tänapäeval väga kättesaadavaks muutunud, ongi kõnesünteesitehnoloogia areng viimasel ajal kiirenenud. "Tänapäevased hääled suudavad olla väljendusrikkad ja kõlada peaaegu nagu inimhääled," lausus Vare.
Kõnesünteesi saab kasutada väga erinevates kohtades, näiteks vestlusrobotites. Näitena saab tuua riigi arendatava vestlusroboti Bürokratt. "Tulevikus võiks olla nii, et võtame oma telefoni, räägime sinna ilusas eesti keeles ja saame siis ka vastuse eesti keeles," ütles Vare.
Kõnesüntees on lisaks ligipääsetavuse mõttes oluline pimedatele, kes kasutavad teksti ettelugemiseks erinevaid ekraanilugejaid. Vare tõi näite, et kui lapsed ei jaksa õpikust peatükke läbi lugeda, siis saavad nad lasta kõnesünteesi abil omale teksti ette lugeda. Järjest rohkem kasutatakse tema sõnul kõnesünteesi ka kõneravis, kus inimesed kuulavad, kuidas sõna hääldada ja proovivad siis järgi öelda. Siinkohal on oluline, et kõnesüntees oleks inimkeelele hästi sarnane.
Selleni, et kõnesünteesi loodud robothääl oleks samal tasemel näitleja häälega, läheb veel aega. Seega ilukirjanduse ja luule lugemine jääb ka ettenähtavas tulevikus näitlejate pärusmaaks. Küll aga tegelevad teadlased sellega, et kõnesüntees oleks järjest väljendusrikkam. Vare rääkis, et on uuritud, kuidas inimesed kõnelevad siis, kui ollakse vihased või rõõmsad. Siis muutuvad intonatsioon ja kõnetempo. "Nii pannaksegi tavalisele sünteeshäälele juurde parameetrid, mis võimaldavad kõne muuta kas kiiremaks, aeglasemaks või vihasemaks," ütles ta.
Vahel võib siiski olla Vare sõnul hea, kui robot räägib roboti häälega. Tartu Ülikooli lastekliinikul on robot Pepper, kes tegeleb kognitiivsete häiretega lastega. "Nendele lastele väga meeldib, et robot räägib natuke robotliku lapsehäälega," lausus Vare.
Kõnerobotid ei häälda aga kõiki sõnu perfektselt välja. Küll oskab kõnesüntees erinevate keeletehnoloogia vahendite tõttu hinnata konteksti. Näiteks sõna palk võib olla nii rahaline tasu kui ka langetatud puu. Olenevalt kumba varianti kasutada, on hääldus erinev. Kõnesüntees suudab sellest vahest Vare sõnul üldiselt aru saada.
Küll aga võib robotite häda olla see, et ei tajuta pilget jutus. "Kui arvuti oskab mõista sarkasmi, irooniat, metafoore ja muid keelenähtusi, siis on meil küll juba olemas tõeline tehisintellekt. Sinnani läheb veel aega," sõnas Vare.
Terves maailmas ollakse ühel meelel, et ellu jäävad need keeled, millel on toimiv omakeelne tehnoloogiline tugi. Vare selgitas, et järjest enam liigutakse sinna suunda, kus inimesed suhtlevad oma igapäevaseadmetega. "Loomulikult on see Eesti riigi eesmärk, et suhtleksime nende seadmetega just eesti keeles ja ilusas eesti keeles," rääkis ta.
Eesti keele positsioon keeletehnoloogia arendamises võrreldes teiste riikidega on Vare sõnul päris hea. "Seda seetõttu, et eesti keeletehnoloogiat on riiklikul tasemel oluliseks peetud ja selle arendamist on sihipäraselt toetatud," lausus Vare.
Tema sõnul oleme jõudnud sinnamaale, kus teadlaste tehtud algsed katsetused ja prototüübid ongi juba päriselt jõudmas kasutusse nii, et me seda võibolla tähelegi ei pane. Näiteks tõlkijad kasutavad tihti tekstide tõlkimiseks masintõlget.
Praegu käib ka kampaania "Anneta kõnet", mis on samuti kõnetehnoloogiaga seotud. Vare rääkis, kui oluline on, et oleks palju eestikeelset materjali, seda nii kirjalikult kui ka kõneldud keele materjali, mille peal saaks tehnoloogiaid treenida. Kampaania algatasid majandus- ja kommunikatsiooniministeerium ja riigi infosüsteemi amet. Eesti Keele Instituutki on andud sinna palju sisendit.
Vare rääkis, et hoogtööna püütakse koguda võimalikult palju spontaanset kõnet erinevatest keskkondadest, olgu need mürased või stuudios salvestatud hea helikvaliteediga räägitud kõne. Seda kõike selleks, et parandada kõnetuvastust.
Soomlasedki on teinud sarnase projekti. Vare rääkis, et nemad said kokku umbes 4000 tunni jagu kõnet. "Oleme endamisi mõelnud, et võiksime siis saada 4000 tundi ja mõned minutid peale," lausus ta.