Sotsiaalmeedia suurandmeid tõlgendada polegi nii lihtne
Kaubandusettevõtted, mobiilirakendused, sotsiaalmeedia – kõik koguvad tänapäeval andmeid kasutajate kohta. Sotsiaalteadlasi huvitavad uued tööriistad, millega tõlgendada andmeid nii, et suurest "andmepajast" välja võttes ei läheks kaduma kontekst ja ühes sellega ka tegelik tähendus, selgitab Tartu ülikooli ühiskonnateaduste instituudi infosüsteemide assistent Maris Männiste.
Suurandmed toovad kaasa hulga võimalusi luua digitaalses ühiskonnas uut väärtust, aga toovad kaasa ka terve hulga probleeme, millele teadlased aina rohkem tähelepanu pööravad. Üks oluline küsimus selle teema kontekstis on: kellele loodud andmed tegelikult kuuluvad? Millised on meie õigused meie enda poolt loodud andmete osas?
Suurandmed tekivad väga erinevate tegevuste käigus, kuid sotsiaalteadlasi huvitavad praegu kõige enam sotsiaalmeedias loodavad andmed. Need, tihti vabatahtlikult ja avalikult sotsiaalmeedia lehekülgedele lisatud andmed, annavad infot inimeste käitumismustritest, arvamustest jms.
Tihti aga jääb taoliste andmete kogumine või kaevandamine oskuste taha. Seega muutub sotsiaalteadlaste "tööriistakast", mis võimaldab seda materjali oma uuringute jaoks sobival moel koguda, sest nii suurte andmekogumite puhul traditsioonilistest meetoditest abi ei ole, ning hiljem ka analüüsida.
Kuid teadlaste kõrval on kommertsettevõtted, kellele annavad need andmed täpselt samamoodi väärtuslikke võimalusi. Lisaks on pidevalt loodavate andmete väärtusest aru saanud ka sotsiaalmeedia platvormide omanikud.
Nii on sotsiaalmeedia suurandmete kättesaamisele ajapikku tekkinud üha enam piiranguid. Seda toetab ka mitmete uurijate viidatud tõik, et tööriistad või vahendid, millega veel mõni aast tagasi sai Twitteri API kaudu andmetele ligi, ei ole täna enam olulised. Kasutada või luua tuleb uusi tööriistu.
"Küpsetatud" andmed
Kriitilised uurijad ei väsi seejuures kunagi rõhutamast, et andmed on paratamatult alati poolikud, valikulised ning "küpsetatud" ehk sotsiaalsete tegutsejate või osalejate loodud.
Näiteks olenemata sellest, kas Twitteris on kokku kolm miljardit kasutajat, kes reaalajas iga päev miljoneid kordi säutsuvad, ei saa me öelda, et tegu on täielike ammendavate andmetega, mis teatud olukordadest meile tervikliku pildi annavad.
Suurandmete tegelik väärtus ei seisne aga niivõrd selles, et ühel või teisel asutusel, ettevõttel, organisatsioonil või riigil on enda hallata meeletud andmekogud. Reaalne väärtus ning uued võimalused peituvad selles, kui erinevaid andmekogusid on võimalik omavahel siduda. Heaks näiteks siinkohal on mitmed mobiilirakendused ehk äpid.
Äpp oma erinevate tervisenäitajate jälgimiseks seotuna mõne spordiäpiga annab kasutajast hoopis täiuslikuma pildi kui annaks vaid ühe või teise poole andmed, ning võimaldab hoopis täpsemaid ennustuslikke analüüse.
Teataval määral on see muutunud justkui ka ootuseks, et teatud algoritmid pakukski meile individuaalselt lahendusi erinevates olukordades, raamatuid, mida on lugenud teised sarnaste huvidega inimesed või teaks, mis võiks olla need kohad, mida me Pariisi külastades soovime.
Privaatsus äpi eest
Koos kõigi nende toredate võimalustega jääb alati üles küsimus privaatsusest. Kas privaatsus enam ongi võimalik? Kuidas seda saavutada? Kui me vabatahtlikult erinevaid teenuseid kasutades anname loa ka enda kohta andmeid koguda (ja tihti neid ka kellegagi veel jagada), siis kuidas hiljem tegelikult nende andmete teekonda või erinevaid tegevusi, mida nendega tehakse, kontrollida?
Dirk Helbing viitab oma raamatus "Thinking Ahead – Essays on Big Data, Digital Revolution, and Participatory Market Society" sellele, et tekkimas on uus lähenemine, mille kaudu jõutakse lõpuks selleni, et privaatsus on kaup mida ostetakse – ehk selle eest, et endast mahasalvestunud andmed kustutada või kätte saada, tuleb maksta.
Seejuures tuleb teadvustada, et mida paremaks muutub analüütika, seda suurem on risk privaatsete andmete lekkimisele. Tehnoloogilised edusammud muudavad privaatsete andmete kogumise tavainimese jaoks tihti nähtamatuks. Palju inimesi aga ongi valmis vahetama oma privaatsuse selle vastu, et külastada mõnd veebilehte või kasutada äppi.
Kaduma kippuv kontekst
Suurandmete analüüsi puhul räägitakse paratamatult ka kaduma minna võivast kontekstist. Suurandmed, mis võivad olla semistruktureeritud või struktureerimata nagu on näiteks ka mitmed sotsiaalmeediast kogutavad andmed, vajavad täiesti teistsuguseid tehnikaid ja meetodeid selleks, et analüüsi käigus oleks võimalik kontekst säilitada ning hiljem ei juhtuks, et andmetele omistatakse kontekst, mida selle esialgne omanik üleüldse silmas ei pidanud.
Teatud määral mõjutab seda kindlasti ka fakt, et kui reaalses elus on inimestel võimalik avalik ja privaatne sfäär oma elus lahus hoida, siis ühiskonnas, kus kõik tegevused on muutunud andmeteks, on see sisuliselt võimatu.
Puudub täielik teadmine, kellel ja millel on ligipääs ning inimese profiil, millest lähtuvalt näiteks reklaame pakutakse või teatud eelistusi määratletakse, võib koosneda nii inimese jaoks eraelulistest kui ka tööalastest andmetest.
Toimetaja: Marju Himma