Teadur: ristkasutatavad arhiivid näitaksid Eesti võlu ja valu ausas valguses
Piltlikult öeldes oleks tarvis kultuuri ja poliitika seeneniidistik luubi alla asetada ja saadud kujutisi suurele kinolinale projitseerida. Nii leiab Tallinna Ülikooli Balti filmi, meedia ja kunstide instituudi nüüdismeedia magistriõppe kuraator Andres Kõnno.
Avaandmete võlu ja valu
Info- ehk teabevabadus kuulub kodanike põhiõiguste hulka ja esmapilgul võib tunduda, et Eestis on sellega kõik hästi. Riigi utsitustöö tulemusel on portaalis avaandmed.eesti.ee kõigile huvilistele kättesaadavaks tehtud 1786 andmestikku 2230 teabevaldajalt.
Kõnno sõnul puudub aga süsteem ja pakutavad andmekogud on väga erineva kvaliteediga: "Mõni tõstab sinna Exceli faili, mõni tõstab faili, millega oskavad toimetada ainult programmeerijad. Mõni tõstab midagi, kus saab päringut teha."
Tallinna Ülikooli teaduri hinnangul ongi nüüd viimane aeg asuda ehitama rakendusi, mis paneksid andmed elama. Võlusõna on metaandmed, ehk andmete kohta käivad andmed. "Need on need andmed, mis on käsitletavad avaandmetena edasijõudnud tähenduses. Andmed, mis on mestitavad või kokkupandavad teiste arhiivide samasuguste avaandmetega," avab ta telgitaguseid.
Ehk teisisõnu: erinevate asutuste arhiivides leiduvat infot võiks riisuda üks ja sama digitaalne reha. Kõnno mõistab, et kõike korraga ei saa. Pigem hellitabki ta lootust, et kui ühe asutusega seda ehitustööd alustada ja järgmine huviline kõrvale tuleks, siis tekiks fänne juurde ning oleks võimalik luua mäluasutuste ristkasutatav arhiiv: "See ei tähenda, et liidame kõik kokku, vaid pigem võiks valmida midagi sarnast nagu praegu on X-tee, mis ID-kaarti teenindab."
Andmebaaside ristkasutatavus aitaks Eesti elu ausamalt ja tõesemalt näha: "Just selline lähenemine käiks avaandmete vaimu ja mõttega õigupoolest kokku," usub Kõnno.
Kes vana asja mäletab, sellel on tehisintellekt sulaseks
Rakendused ise oleks ainult pool rehkendust. Teise poole moodustaks see, kuidas rakendusi kasutades ühiskonnas toimuvat mõtestada. "Suhteid inimeste ja organisatsioonide vahel on kujuteldamatult palju. Kuidas tekitada tüpoloogia, mis neid suhteid teemavaldkondade kaupa kirjeldada suudaks? Ja sealt edasi: teemade tuvastamine. Kuidas automaatselt tuvastada teemasid kultuuris, majanduses või mujal? Selles ongi küsimus," visandab Kõnno järgmisi samme, mille võtmesõnaks on masinanalüüs.
Just masinanalüüs aitaks tuvastada seoseid, mille olemasolu ka tähelepanelik vaatleja fragmenteeritud andmete maailmas tuvastada ei suuda. Kõnno toob näiteks Eesti meediaorganisatsioonide arhiivid, kust käib läbi kogu Eesti elu: "Kui keegi satub millegagi pilti, aga mitte liiga prominentselt, siis võidakse see aja pikku ära unustada, aga masin ei valeta ja kõik olemasolevad seosed tulevad tähenduslikuna välja."
Siit koorubki avaandmete krati üks esimesi praktilisi funktsioone: olla ajakirjanike töövahend, millega terasid sõkaldest eraldada.
Meediaorganisatsioonide andmestike tõeline avamine tuleks Kõnno sõnul kasuks ka üldise meediapädevuse tõstmisel. Õpetajad ja koolitajad saaksid hõlpsa vaevaga leida aktuaalseid näiteid selle kohta, kuidas kõik, mis meedias ilmub, ei pruugi olla puhas kuld.
Kolmas kasutegur ilmneb seoses üldise lähiajaloos orienteerumisega. "Praegu ülikooli astuvad tudengid on sündinud aastal umbes 2004. Nad pole Eesti krooni käeski hoidnud. Neil puuduvad isiklikud mälestused Eesti poliitikas toimunust ja selle jälgimise kogemus," nendib Kõnno.
Just lähiajaloo uurimine ja teadmine, kuidas me õigupoolest oleme jõudnud siia, kuhu praeguseks jõudnud oleme, on tema sõnul poliitilise kultuuri jaoks elulise tähtsusega. "On vaja mõista, kust otsused tulevad ja mis on eelnõude ja argumentide tekkelugu. Muidu võib igaüks tulla ja midagi välja mõelda ja rääkida ja kõik noogutavad pead," toob ta näite.
Kõik põhineb keelel
Kõnnot kuulates jääb mulje, et meediamaastikult kogu ühiskonna hõlmamiseni on vaid üks samm. Või pool. "Keeletehnoloogia rakendamine on võimalik kõigis valdkondades – ka neis, mis esmaspilgul sellega otseselt seotud pole," väidab ta. Kuidas nii? Sest kogu ühiskonnakorraldus põhineb keelel. "Nii sellel keelel, mida inimesed räägivad ja kirjutavad, kui ka sellel, millele toetudes töötavad arvutid. Ka liiklusmärgid on omamoodi keel," loetleb ta.
Paraku tuleb aga arvestada ka keele enese muutumise ja sellega seotud väljakutsetega. Hetkel kasutusel olev keeletehnoloogia on valminud tänase eesti keele pinnal, selle tiivad on aga kärbitud ja väga kaugele minevikku temaga lennata ei saa. "Isegi 1980. ja 1970. aastate eesti keel on nii teistsugune, et algoritm hakkab vigu tegema," nendib teadur.
Tehisaru teeb andmetega toimetamise palju lihtsamaks ja on vaieldamatult revolutsiooniline, kuna mõne üksiku teenistuja asemel analüüsiksid andmeid justkui sajad tuhanded või lausa miljonid silmapaarid. Ometi ei kao Kõnno sõnul inimliku sekkumise vajadus niipea: "Ei saa eeldada, et algoritm oskab ära tunda, mis on tõde ja mis on vale. Küll aga oskab see kiiresti leida üles seosed, mis on ebaharilikud."
Kõnno usub, et kui avaandmeid pidevalt juurde tuleb ja nende peale rajatavat metatasandit rohtu kasvada ei lasta, siis on vaid aja küsimus, kui digitaalne ökosüsteem ise jalad alla saab. "Sellele ehituvad uued ja ägedad teenused, mida me praegu ette kujutadagi oska," unistab ta.
Aastal 2021 lõid Kõnno ja tema kolleegid ühe prototüübi, uus loodetakse valmis saada 2024. aasta märtsis. Kui palju see kõik aga avalikkust mõjutada suudaks? "Ma pole idealist. Selge see, et see jääb väiksema ja harituma seltskonna mänguasjaks, aga kui seda kasutaks 4000–5000 inimest, siis oleks juba väga hea," arutleb Kõnno.
Toimetaja: Jaan-Juhan Oidermaa