Sotsiaalmeedia suurandmeid tõlgendada polegi nii lihtne ({{commentsTotal}})

Sotsiaalmeedia suurandmete kättesaamisele on ajapikku tekkinud üha enam piiranguid.
Sotsiaalmeedia suurandmete kättesaamisele on ajapikku tekkinud üha enam piiranguid. Autor/allikas: Merrill College of Journalism Press Releases/Creative Commons

Kaubandusettevõtted, mobiilirakendused, sotsiaalmeedia – kõik koguvad tänapäeval andmeid kasutajate kohta. Sotsiaalteadlasi huvitavad uued tööriistad, millega tõlgendada andmeid nii, et suurest "andmepajast" välja võttes ei läheks kaduma kontekst ja ühes sellega ka tegelik tähendus, selgitab Tartu ülikooli ühiskonnateaduste instituudi infosüsteemide assistent Maris Männiste.

Suurandmed toovad kaasa hulga võimalusi luua digitaalses ühiskonnas uut väärtust, aga toovad kaasa ka terve hulga probleeme, millele teadlased aina rohkem tähelepanu pööravad. Üks oluline küsimus selle teema kontekstis on: kellele loodud andmed tegelikult kuuluvad? Millised on meie õigused meie enda poolt loodud andmete osas?

Suurandmed tekivad väga erinevate tegevuste käigus, kuid sotsiaalteadlasi huvitavad praegu kõige enam sotsiaalmeedias loodavad andmed. Need, tihti vabatahtlikult ja avalikult sotsiaalmeedia lehekülgedele lisatud andmed, annavad infot inimeste käitumismustritest, arvamustest jms.

Tihti aga jääb taoliste andmete kogumine või kaevandamine oskuste taha. Seega muutub sotsiaalteadlaste "tööriistakast", mis võimaldab seda materjali oma uuringute jaoks sobival moel koguda, sest nii suurte andmekogumite puhul traditsioonilistest meetoditest abi ei ole, ning hiljem ka analüüsida.

Kuid teadlaste kõrval on kommertsettevõtted, kellele annavad need andmed täpselt samamoodi väärtuslikke võimalusi. Lisaks on pidevalt loodavate andmete väärtusest aru saanud ka sotsiaalmeedia platvormide omanikud.

Nii on sotsiaalmeedia suurandmete kättesaamisele ajapikku tekkinud üha enam piiranguid. Seda toetab ka mitmete uurijate viidatud tõik, et tööriistad või vahendid, millega veel mõni aast tagasi sai Twitteri API kaudu andmetele ligi, ei ole täna enam olulised. Kasutada või luua tuleb uusi tööriistu.

"Küpsetatud" andmed

Kriitilised uurijad ei väsi seejuures kunagi rõhutamast, et andmed on paratamatult alati poolikud, valikulised ning "küpsetatud" ehk sotsiaalsete tegutsejate või osalejate loodud.

Näiteks olenemata sellest, kas Twitteris on kokku kolm miljardit kasutajat, kes reaalajas iga päev miljoneid kordi säutsuvad, ei saa me öelda, et tegu on täielike ammendavate andmetega, mis teatud olukordadest meile tervikliku pildi annavad.

Suurandmete tegelik väärtus ei seisne aga niivõrd selles, et ühel või teisel asutusel, ettevõttel, organisatsioonil või riigil on enda hallata meeletud andmekogud. Reaalne väärtus ning uued võimalused peituvad selles, kui erinevaid andmekogusid on võimalik omavahel siduda. Heaks näiteks siinkohal on mitmed mobiilirakendused ehk äpid.

Äpp oma erinevate tervisenäitajate jälgimiseks seotuna mõne spordiäpiga annab kasutajast hoopis täiuslikuma pildi kui annaks vaid ühe või teise poole andmed, ning võimaldab hoopis täpsemaid ennustuslikke analüüse.

Teataval määral on see muutunud justkui ka ootuseks, et teatud algoritmid pakukski meile individuaalselt lahendusi erinevates olukordades, raamatuid, mida on lugenud teised sarnaste huvidega inimesed või teaks, mis võiks olla need kohad, mida me Pariisi külastades soovime.

Privaatsus äpi eest

Koos kõigi nende toredate võimalustega jääb alati üles küsimus privaatsusest. Kas privaatsus enam ongi võimalik? Kuidas seda saavutada? Kui me vabatahtlikult erinevaid teenuseid kasutades anname loa ka enda kohta andmeid koguda (ja tihti neid ka kellegagi veel jagada), siis kuidas hiljem tegelikult nende andmete teekonda või erinevaid tegevusi, mida nendega tehakse, kontrollida?

Dirk Helbing viitab oma raamatus "Thinking Ahead – Essays on Big Data, Digital Revolution, and Participatory Market Society" sellele, et tekkimas on uus lähenemine, mille kaudu jõutakse lõpuks selleni, et privaatsus on kaup mida ostetakse – ehk selle eest, et endast mahasalvestunud andmed kustutada või kätte saada, tuleb maksta.

Seejuures tuleb teadvustada, et mida paremaks muutub analüütika, seda suurem on risk privaatsete andmete lekkimisele. Tehnoloogilised edusammud muudavad privaatsete andmete kogumise tavainimese jaoks tihti nähtamatuks. Palju inimesi aga ongi valmis vahetama oma privaatsuse selle vastu, et külastada mõnd veebilehte või kasutada äppi.

Kaduma kippuv kontekst

Suurandmete analüüsi puhul räägitakse paratamatult ka kaduma minna võivast kontekstist. Suurandmed, mis võivad olla semistruktureeritud või struktureerimata nagu on näiteks ka mitmed sotsiaalmeediast kogutavad andmed, vajavad täiesti teistsuguseid tehnikaid ja meetodeid selleks, et analüüsi käigus oleks võimalik kontekst säilitada ning hiljem ei juhtuks, et andmetele omistatakse kontekst, mida selle esialgne omanik üleüldse silmas ei pidanud.

Teatud määral mõjutab seda kindlasti ka fakt, et kui reaalses elus on inimestel võimalik avalik ja privaatne sfäär oma elus lahus hoida, siis ühiskonnas, kus kõik tegevused on muutunud andmeteks, on see sisuliselt võimatu.

Puudub täielik teadmine, kellel ja millel on ligipääs ning inimese profiil, millest lähtuvalt näiteks reklaame pakutakse või teatud eelistusi määratletakse, võib koosneda nii inimese jaoks eraelulistest kui ka tööalastest andmetest.

Toimetaja: Marju Himma



Vaade Emajõele.Vaade Emajõele.
Teadlased ei näe Emajõe tselluloositehase plaane loodussäästlikena

Eesti puidu väärindamine on teretulnud, kuid praeguste pealiskaudsete andmete põhjal tehtud analüüside põhjal on küsitav, kas Emajõgi kannaks välja tehasest tuleva lisareostuse. Paistab ka, et riigil pole plaani, kuidas majandada metsa siis, kui Tartumaal on ettevõte, kes on valmis ära ostma kõik Eesti ekspordiks mineva puidu. Tselluloositehase mõjude üle veele ja metsale arutlesid Teaduste Akadeemia seminaril Tartu teadlased.

Väiksemad planeedid jagunevad kahte selgesse rühma

Alles see oli, kui teadlased ei teadnud väljaspoolt meie Päikesesüsteemi ühtegi planeeti, kuid nüüd on nn eksoplaneete hakatud avastama suurel kiirusel ja hulgakaupa. NASA kosmoseteleskoobi Kepler abiga on nüüd äsja üles leitud ja teatavaks tehtud ühekorraga lausa 219 uut planeedikandidaati.

Osama bin Laden.Osama bin Laden.
Doktoritöö analüüsis Usāma ibn Lādini sõnumeid uudse meetodiga

Tallinna ülikooli doktorant Helen Geršman uuris Saudi Araabiast pärit Usāma ibn Lādini kirjalikke ja suulisi sõnumeid retoorilisest vaatenurgast, mida pole sarnaselt varem analüüsitud.