Video: uued sõnad jõuavad sõnaraamatusse 500 miljoni sõne hulgast
Küberhügieen, orsoto, moekaup, topieemaldi, proteoomika, jutujalal, kauguuendamine – need on vaid mõned sõnad, mille leiab järgmisel aastal ilmuvast eesti keele seletavast sõnaraamatust. Mida need tähendavad ja kuidas sellised sõnad üldse leiavad tee sõnaraamatusse?
Eilse „Uudishimu tippkeskuse“ keeleteemalise saate jätkuks käis saate teadustoimetaja Marju Himma Eesti keele instituudis (EKI), kus uuris sõnaraamatute peatoimetajalt Margit Langemetsalt, kuidas koostatakse uut õigekeelsussõnaraamatut ja eesti keele seletavat sõnaraamatut ning kuidas saavad sinna sisse sellised uudissõnad, nagu orsoto või baarikärbes.
Näiteks sõna küberhügieen on läinud laialt kasutusele. ERRi teadusportaali Novaator toimetajad on kasutanud samas tähenduses küll digihügieeni, samas mõni poliitik armastab jällegi rohkem küberhügieeni. Kumb on õige ja kuidas see sõnaraamatusse saab?
Margit Langemets selgitab, et mõlemad on õiged. Mõlemad on sõnaraamatute koostajate andmebaasi lisandunud üsna hiljaaegu ning tähendavad sama asja. „Ma panin selle kirja umbes nii: riigi, asutuse ja inimese enda enda hool, kuidas ta oma digiseadet kasutab.“ See hõlmab kogu turvakäitumist digiseadmes.
Uusi sõnu tulebki meie igapäevakasutuses. Nii on hiljutine ID-kaardi probleem toonus kasutusse sõna kauguuendamine, mis samuti leiab oma tee sõnaraamatusse. Samas näiteks sõna moekaup on tavakasutuses olnud pikka aega, kuid pole veel jõudnud sõnaraamatusse.
Uusi leide tuleb keeleteadlaste andmebaasi iga päev, paljud neist leiavad tee ka sõnaraamatusse ja see paneb küsima, kas keele muutumine on halb? „Ei ole mõtet karta, et keel muutub.“ Keele muutumises ei ole midagi halba, leiab Langemets.
Natuke on keele muutmisele vastu olemine seotud koolis õpituga: inimesed on koolis ära õppinud sel hetkel kehtivad keelereeglid ja neist on keele muutudes raske loobuda.
Kui ilmneb, et esineb väga massiliselt keele väärkasutust, siis koguneb keeletoimkond ja arutab seda juhtumit. Seega hoiavad keelekorraldajad keelel pidevalt silma peal.
Kas teadsid, et:
- Sõnaraamatutes, olgu nendeks õigekeelsussõnaraamat (ÕS) või seletav sõnaraamat, on 50 000 – 150 000 sõna.
- 2018. aastal ilmuvasse seletavasse sõnaraamatusse tuleb 105 – 110 000 sõna.
- Nende läbivaatamine on väga aja- ja töömahukas. Samas on näiteks huvitav teada, et seletavat sõnaraamatut paneb kokku vaid neli inimest.
Uus sõnaraamat valmib 500 miljonit eestikeelset sõne sisaldava korpuse abil.
Keeleteadlaste tööriistaks on keelekorpus, kuhu kuulub 500 miljonit sõne ehk sõnade erinevaid vorme.
Sellesse korpusesse koguvad tekste spetsiaalsed programmid automaatselt, mis kaevavad veebist välja kõik tekstid, kus programm tunneb ära eesti keele.
„See ongi see koht, kus keele tervis läheb kokku keeletehnoloogiaga,“ märgib Langemets. Mida paremini töötab see tekstikorpus, seda paremini areneb ka masintõlge.
Nendest 500 miljonist sõnest saab spetsiaalse programmi abil vaadata, millised sõnakasutused tõusevad esile ja millised vähem. Samuti saab sealt teada, millised uued sõnad on tulnud kasutusele. „Selle tekstikorpuse najal me oma sõnaraamatut koostame,“ nentis Langemets.
See tekstikorpus on üks põhjus, miks keeleteadlased soovitavad veebis eelistada kindlasti eestikeelsete tekstide avaldamist – nii satuvad need ka teksti korpusesse. „Ärge andke veebi ingliskeelseid tekste, andke eestikeelseid tekste,“ soovitab Langemets.
Eriti tasub seda silmas pidada teadlastel, kes sageli rahvusvaheliselt kolleegidega suhtlevad inglise või mõnes muus võõrkeeles. „Kui eesti teadlane kirjutab ainult inglise keeles, siis see osa eesti keelest kaob meie vaateväljast täitsa ära ja see puudutab absoluutselt iga valdkonda,“ sedastas Langemets.
Selleks, et eesti keeles oleksid olemas ka teadusterminid, tuleb need tõlkida eesti keelde ning avaldada ka eesti keeles, miks mitte mõne populaarteadusliku artiklina, näiteks ERR Novaatoris.
Uus õigekeelsussõnaraamat ilmub juba järgmisel sügisel ning sealt leiab ka mitu uut sõna. Mida need sõnad tähendavad, saab testida alljärgnevas viktoriinis.