Infotehnoloogia doktoritöö annab tööriista keelte vormiõpetuse uurimiseks
Maailmas on ligi 7000 kõneldavat keelt, neist enamuse jaoks ei ole ei vastava tasemega keeleteadlasi ega sobilikku süsteemset arvutikäsitlust. Kuna tulevikus peaks inimkeeles suhtlemine olema üks peamisi arvutitega suhtlemise viise, siis on inimkeelte töötlemise valdkonna uurimine kiiresti arenev ja praegu väga aktiivne.
Kairit Sirts kaitseb täna Tallinna tehnikaülikooli juures doktoritööd, mis keskendub sellele, kuidas oleks võimalik inimkeele töötlemist automatiseerida, et võimaldada seda ka nendes keeltes, kus praegu puuduvad vastavad lahendused. Doktoritöö põhieesmärk on uurida inimkeelte töötlemist, sest see on tulevikus üks peamisi arvutiga suhtlemise viise.
Peaaegu kõik raallingvistilised süsteemid loomulike keelte struktuuri töötlemiseks on loodud suuremahuliste inim-masin süsteemidena. Heatasemeliste tulemuste saavutamiseks on tavaliselt vaja väga kvalifitseeritud keeleteadlaste üpris tõsist ja kallist eelnevat käsitsitööd.
Kairit Sirtsu väitekirja tulemused annavad rea mudeleid ja vahendeid sõnastruktuuride automaatuurimiseks üsna vähese tekstihulga või hoopis töötlemata näitelausete põhjal. Doktoritöö tulemused aitavad paljudel väiksematel keeltel oluliselt napimate kulutustega alustada keele vormiõpetuse uurimist, näiteks sõnamoodustuse reegleid, sõnade sisemist struktuuri ja sõnade omavahelisi seoseid.
Doktoritööd juhendasid dr Sharon Goldwater Edinburghi ülikoolist ning emeriitprofessor Leo Võhandu Tallinna tehnikaülikoolist. Oponendid on dr Mikko Kurimo Aalto ülikoolist ning Microsoft’i teadur dr Kristina Toutanova.
Tegu 100. Tallinna tehnikaülikoolis IKT valdkonnas kaitstud dissertatsiooniga.
Toimetaja: Marju Himma