Doktoritöö: Eesti andmeeksperte huvitab kasumi asemel kasu
Andmestunud ühiskonnas jätab iga veebis tehtud tegevus maha andmejälje. Oluline vedur andmetehnoloogiate ja andmepraktikate ning seeläbi ka ühiskonna kujundamisel on siin andmeeksperdid. Tartu Ülikooli doktoritöö keskendub just neile ning osutab, et ehkki eksperdid näevad andmetes suurt väärtust, kammitsevad neid ligipääsupiirangud ja ärihuvidega osapoolte eelisseisund.
"Pole oluline, kas räägime suurandmetest või lihtsalt andmetest," ütleb Tartu Ülikooli infosüsteemide nooremlektor Maris Männiste: "Igal juhul tekitab andmete kasutamine laiemaid ühiskondlikke kujutelmi sellest, mida me andmetega teha saame, kuidas nende kasutamine võib ühiskonnas kellelegi kasulik olla ja milliseid lähenemisi kaasa tuua."
Oma hiljuti kaitstud doktoritöös huvitasidki Männistet suurandmete võimaluste ja ohtudega seotud arusaamad ühiskonnas ja andmeekspertide seas. Ta keskendus nii Eesti andmeekspertide rollile suurandmete kasutamisel kui ka andmetehnoloogiate arendamisel ja seeläbi lõppkasutaja kogemuse kujundamisel. Samuti vaatas Männiste läbi aastail 2012–2016 ilmunud ühismeediat puudutavad andmeuuringud ja uuris, kuidas on suurandmetega seotud kujutelmad mõjutanud teadlaste tööd.
Väärtus ei tähenda tingimata raha
Esiteks huvitas Maris Männistet, millised on andmepioneeride arusaamad ja kujutluspildid seoses suurandmetega. "Pioneer olemine ei pruugi tähendada, et nad saavad millelegi esimesena ligi, vaid on pigem seotud mõtteviisiga, et nad näevad andmetes võimalust. Nad on valmis andmetega eksperimenteerima ja neil on huvi andmete kaudu ühiskonnas mingisugust väärtust luua," selgitab ta.
Näiteks võib andmepioneerideks pidada erinevaid veebikogukondi, nagu häkkereid ja iseenda andmete jälgijaid, aga ka andmeeksperte ehk teadlasi, analüütikuid, andmetehnoloogiate nagu e-resistentsuse arendajaid ja andmeanalüüsile toetuvaid nõunikke ministeeriumites. "Neil kõigil on hästi erinev roll. Ometi see, mida nemad oma töö käigus teevad, kuidas andmeid kasutavad, millised võimalused või ligipääsud neil on andmetega seoses – see kõik mõjutab, millises andmeühiskonnas me elame," sõnab Männiste.
Intervjuudes tõid andmeeksperdid esiteks välja, et nii era- kui ka avalikus sektoris nähakse andmetes konkurentsieelist. Männiste sõnul ei kipu paljud eksperdid isegi teiste avaliku sektori osapooltega oma andmeid jagama enne, kui on need ise läbi analüüsinud. "Nad leiavad, et kui andmetesse süüvida, siis äkki leidubki seal mõni muster, mis on just neile väga väärtuslik ja siis on neil mõistlik see ise ära kasutada, mitte teistega jagada. Paraku, see kujutelm võib natuke pärssida koostööd," märgib ta.
Teiseks näevad andmepioneerid suurandmetes võimalust paremini valitseda, teenuseid luua ning uurida ja mõista ühiskondlikke protsesse ja inimeste käitumist. "Kui eraettevõtted on tugevalt kannustatud majanduslikust heaolust, siis nende andmeekspertide puhul, kellega mina rääkisin, jäi silma kannustatus väärtusest ehk ka teatava sotsiaalse heaolu loomisest," ütleb nooremlektor.
Väärtuste loomine võib tema sõnul näiteks tähendada, et ekspert pakub kliendile parema lahenduse, kui too esialgu küsis. "Klient näiteks soovib, et organisatsioon teeks küsitluse, mida inimesed kindlal teemal arvavad. Organisatsiooni andmeekspert aga pakub, et andmed on erinevates andmebaasides juba olemas ja neid liites on võimalik jõuda analüüsideni, mis aitavad teemat hoopis paremini mõista," toob Männiste näite.
Samuti rääkisid eksperdid, et püüavad oma asutuses tekitada andmekultuuri ehk tutvustada kolleegidele uusi digitaalseid töölahendusi. "Kui midagi näiteks tehti varem Excelis, siis nüüd pakkusid nad välja mingi muu lahenduse või programmi, mida selleks kasutada," märgib nooremlektor.
Ehkki Männiste märgib, et tema intervjueeritavate seas oli palju avaliku ja kolmanda sektori andmepioneere, jäi intervjuudest ikkagi selgelt kõlama soov pakkuda andmete abil väärtust, mis poleks üksnes majanduslik heaolu ning arvestaks ka üksikisiku õigustega. "Nad rõhutasid veel väga, et andmeeksperdil on vastutus ja tasakaalu leidmine üksikisiku ja organisatsiooni huvide vahel võib-olla kohati päris keeruline," ütleb ta.
Võim on andmepakkuja käes
Eriti seoses teadlastega tuli Maris Männiste töös välja arusaam, et andmeeksperdi tegutsemine sõltub tehnoloogilistest võimalustest ja ligipääsust andmetele. Alates 2012. aastast ilmunud teadustöid läbi vaadates täheldas nooremlektor, et peamiselt analüüsitakse neis Twitteri andmeid. "See on suuresti seotud sellega, et Twitteri andmetele on teadlastel olnud parem ligipääs ja neil on selleks paremad tööriistad ja vahendid olemas," põhjendab ta.
Kui Twitter on ise andmepioneeride tööd hõlbustanud, siis Facebook on nooremlektori sõnul aastate jooksul hoopis üha enam andmekraane kinni keeranud. "Ehk eraettevõttel, kelle käes on andmed, on päris suur võim selles osas, kes andmetele ligi pääseb ja mida ta nende andmetega teha saab," tõdeb Männiste.
Nii ei saa ühiskondlikest protsessidest huvitatud teadlased alati andmepõhist uurimistööd teha, sest neid lihtsalt ei lasta andmetele ligi. Teinekord võib teadlane saada küll andmetele ligipääsu, kuid ei tohi öelda, mis keskkonna andmetega on tegu. "Ühel juhul näiteks analüüsiti ühe kohtinguportaali andmeid ja selle organisatsiooni nõudmine oli, et teadustöös nimetataks edaspidi nende portaali valenimega," toob Männiste välja ja märgib, et see näitab andmepakkuja võimu andmesuhtes.
Twitterist saab nooremlektori sõnul tuua teisegi näite, kuidas teadlaste käsutuses olevad tööriistad määravad ära, millised andmed nad analüüsimiseks kätte saavad. Üks võimalus Twitteri andmeid uurida on laadida selle rakenduse kaudu huvipakkuvad andmed alla ja kasutada teiste sotsiaalteadlaste loodud tasuta tööriistu. Teine võimalus on luua ise tööriistu ja lahendusi, aga selleks on Männiste sõnul vaja rohkem ressursse, kui neid seni sotsiaalteadlastel olnud on.
"See viis omakorda selleni, et eriti algusaastatel tehti interdistsiplinaarset koostööd, et üldse andmetele paremini ligi pääseda," kirjeldab ta teadlaste tööpraktikate tagamaid. Kui algul polnud uuringute eesmärk Männiste sõnul niivõrd uut teadmist pakkuda, vaid mõista, mida üldse suurandmetega teha saab, siis nüüd on töö kese nihkunud uute teadmiste poole.
Kas kasutustingimustega saab nõustumata jätta?
Oma töös leidis Maris Männiste kvantitatiivse analüüsi põhjal sedagi, et rääkides suurandmetest, on väga oluline üksikisiku usaldus andmetega tegelevate asutuste vastu. "Aina olulisem on, et ettevõtete ja organisatsioonide tegevus andmetega oleks läbipaistev ja üksikisikule arusaadav," ütleb ta: "See mõjutab, mil määral me neid oma andmetega seotud tegevustes usaldame."
Intervjuudes tõid andmeeksperdid välja, et muutunud andmesuhete valguses on äärmiselt oluline iga inimese isiklik andmekirjaoskus. See võib Männiste sõnul olla vajalik kas või selleks, et nähes meedias mõnd vigast graafikut, saaks lugeja ajakirjanikule teada anda, et midagi on valesti. "Samas andmekirjaoskus ei aita sul omada täit ülevaadet, kes milliseid andmeid koguvad ja kellega tegelikult neid andmeid jagatakse," möönab ta.
Eriti eraettevõtete puhul puudub inimesel endal oma andmete üle suuresti kontroll. "Isegi juhul, kui anname igale poole nõusoleku ja teame, et meie andmeid jagatakse kolmandate osapooltega, ei tea me väga tihti, kes need kolmandad osapooled on, ja mida täpselt nad meie andmetega teevad," osutab nooremlektor.
Andmeeksperdid tõid välja, et kuna üksikisikul on väga raske sellest ülevaadet saada, on tal ka väga keeruline midagi ette võtta. Männiste sõnul on praegusi andmelahendusi kritiseerinud ka paljud teadlased. "Kui hakkame mõnd veebirakendust kasutama või läheme uuele veebilehele, siis peame mingisuguste kasutustingimustega nõustuma. Tänane paratamatus on, et ega meil muud võimalust ei ole," sedastab ta. Inimese võimestamise asemel annab selline nõustumine nooremlektori sõnul pigem näilise tunde, et olukord on inimese kontrolli all.
Eesti on selles küsimuses Männiste sõnul omal moel pioneer, sest riigi infosüsteemide amet arendab välja uut nõusolekuteenust. "See võib olla üks lahendus, mis tulevikus aitab üksikisikul saada palju parema kontrolli oma andmete üle," seletab ta: "Meil vähemalt on siis ülevaade, kellega me oleme mingis kontekstis mingeid andmeid jaganud Samuti saame seal oma nõusoleku tagasi võtta." Siiski toimiks hetkel uus lahendus ainult Eesti kontekstis ja laiemas vaates jääksid andmemured alles.
Männiste sõnul on üksikisiku roll andmemaailmas küll muutunud, aga kindlasti ei tohi teda pidada täiesti passiivseks osaliseks. Näiteks mängib kasutaja teadlikult TikToki algoritmiga, kui sisestab otsingusse kindlaid sõnu, et edaspidi sel teemal videoid näha. "Sellega ma ise kasutajana kujundan oma kogemust ja mõjutan ka seda, milliseid reklaame mulle edaspidi pakutakse," ütleb Männiste.
Maris Männiste kaitses meedia ja kommunikatsiooni erialal doktoritöö "Big data imaginaries of data pioneers: changed data relations and challenges to agency" ("Andmepioneeride suurandmetega seotud kujutluspildid: muutunud andmesuhted ja agentsust puudutavad väljakutsed") 12. aprillil Tartu Ülikoolis. Tööd juhendasid Tallinna Tehnikaülikooli ja Tartu Ülikooli kaasprofessor Anu Masso ning Tartu Ülikooli professor Andra Siibak.