Eesti kõnerobotil on voolavas tämbris veel arenguruumi
Keeletehnoloogia kiire arengu tuules on viimase 15 aastaga oluliselt loomulikumaks muutunud ka eestikeelne kõnesüntees. EKI keele- ja kõnetehnoloogia osakonna juhataja Kadri Vare sõnul tuleb ingliskeelse kõnerobotiga võrreldava sorava kõne nimel eesti keelega siiski veel tööd teha.
"Kui vaatame, milline oli meie 15 aasta tagune robothääl ja milline see on praegu, siis see eesti keele kõnesüntees on väga palju paranenud. See hääl on palju väljendusrikkam, palju loomulikum ja sarnaneb väga palju rohkem inimesele," kirjeldas Vare saatest "Terevisioon".
Kõnerobot õpib juttu kokku panema suure andmehulga põhjal. Vare sõnul vajab kõneroboti tehisaru trennitegemiseks just suulist kõnet ehk erinevate inimeste sisse loetud helikatkendeid. "Selle jaoks, et teha võimalikult ilusat loomulikku kõnesünteesi, ongi vaja, et inimdoonor, kes seda häält sisse loeb, oleks hästi hea hääle ja diktsiooniga," täpsustas ta.
Eesti keele instituut tegi oma kõnerobotiga hiljuti katseprojekti, kus tehishääl pidi ette lugema erinevaid reklaamtekste. "[Meil] oli võimalik ära kasutada reklaami häälepanku, kus näitlejad olidki lugenud oma häälenäidised ette nii rahulikus kui ka energilises võtmes," kirjeldas Vare. Häälepanga põhjal õpetati olemasolevale sünteeshäälele, kuidas esitada teksti kord energilisemal ja kord rahulikmal toonil.
Helinäiteid kuulates ilmnes, et täiskasvanuhäälega ette loetud reklaamid mõjuvad veel konarlikult. Vare sõnul kasutab eestikeelne robot küll kõige moodsamaid närvivõrke, kuid pole ikka veel võimeline kõnes voolavust tekitama. "Seda küll inglise keele jaoks on praegu täiesti võimalik teha, aga eesti keel õnneks või kahjuks on väike keel. Selle jaoks on veel vaja seda sünteesi väljendusrikkust arendada," põhjendas ta. Samuti ilmnes, et kuulajatele meeldis rahulikum toon energilisemast rohkem.
Seevastu lapsehäälega kõnerobot võib kuulaja tõenäolisemalt ära petta. Vare sõnul võib põhjus olla selles, et lapshääle taga on juba uue põlvkonna sünteeshääl. Kuna kõige loomutruumalt mõjub energiliselt kõnelev lapshääl, oletab Vare, et lapsed kõnelevadki emotsionaalsemalt.
"Eelkõige on sünteeshääl mõeldud ligipääsetavuse parandamiseks. Pimedad ja vaegnägijad kasutavadki oma elus tarbetekstide ettelugemiseks just neid samu sünteeshääli ja ekraanilugejaid," selgitas ta katse peamist tagamõtet. Lisaks saab erinevas tempos tehishäält Vare sõnul kasutada avaliku ruumi teadete esitamiseks ja eesti keele õppes.
Toimetaja: Airika Harrik
Allikas: "Terevisioon". Küsis: Reimo SIldvee.