Sotsiaalmeedia suurandmeid tõlgendada polegi nii lihtne ({{commentsTotal}})

Sotsiaalmeedia suurandmete kättesaamisele on ajapikku tekkinud üha enam piiranguid.
Sotsiaalmeedia suurandmete kättesaamisele on ajapikku tekkinud üha enam piiranguid. Autor/allikas: Merrill College of Journalism Press Releases/Creative Commons

Kaubandusettevõtted, mobiilirakendused, sotsiaalmeedia – kõik koguvad tänapäeval andmeid kasutajate kohta. Sotsiaalteadlasi huvitavad uued tööriistad, millega tõlgendada andmeid nii, et suurest "andmepajast" välja võttes ei läheks kaduma kontekst ja ühes sellega ka tegelik tähendus, selgitab Tartu ülikooli ühiskonnateaduste instituudi infosüsteemide assistent Maris Männiste.

Suurandmed toovad kaasa hulga võimalusi luua digitaalses ühiskonnas uut väärtust, aga toovad kaasa ka terve hulga probleeme, millele teadlased aina rohkem tähelepanu pööravad. Üks oluline küsimus selle teema kontekstis on: kellele loodud andmed tegelikult kuuluvad? Millised on meie õigused meie enda poolt loodud andmete osas?

Suurandmed tekivad väga erinevate tegevuste käigus, kuid sotsiaalteadlasi huvitavad praegu kõige enam sotsiaalmeedias loodavad andmed. Need, tihti vabatahtlikult ja avalikult sotsiaalmeedia lehekülgedele lisatud andmed, annavad infot inimeste käitumismustritest, arvamustest jms.

Tihti aga jääb taoliste andmete kogumine või kaevandamine oskuste taha. Seega muutub sotsiaalteadlaste "tööriistakast", mis võimaldab seda materjali oma uuringute jaoks sobival moel koguda, sest nii suurte andmekogumite puhul traditsioonilistest meetoditest abi ei ole, ning hiljem ka analüüsida.

Kuid teadlaste kõrval on kommertsettevõtted, kellele annavad need andmed täpselt samamoodi väärtuslikke võimalusi. Lisaks on pidevalt loodavate andmete väärtusest aru saanud ka sotsiaalmeedia platvormide omanikud.

Nii on sotsiaalmeedia suurandmete kättesaamisele ajapikku tekkinud üha enam piiranguid. Seda toetab ka mitmete uurijate viidatud tõik, et tööriistad või vahendid, millega veel mõni aast tagasi sai Twitteri API kaudu andmetele ligi, ei ole täna enam olulised. Kasutada või luua tuleb uusi tööriistu.

"Küpsetatud" andmed

Kriitilised uurijad ei väsi seejuures kunagi rõhutamast, et andmed on paratamatult alati poolikud, valikulised ning "küpsetatud" ehk sotsiaalsete tegutsejate või osalejate loodud.

Näiteks olenemata sellest, kas Twitteris on kokku kolm miljardit kasutajat, kes reaalajas iga päev miljoneid kordi säutsuvad, ei saa me öelda, et tegu on täielike ammendavate andmetega, mis teatud olukordadest meile tervikliku pildi annavad.

Suurandmete tegelik väärtus ei seisne aga niivõrd selles, et ühel või teisel asutusel, ettevõttel, organisatsioonil või riigil on enda hallata meeletud andmekogud. Reaalne väärtus ning uued võimalused peituvad selles, kui erinevaid andmekogusid on võimalik omavahel siduda. Heaks näiteks siinkohal on mitmed mobiilirakendused ehk äpid.

Äpp oma erinevate tervisenäitajate jälgimiseks seotuna mõne spordiäpiga annab kasutajast hoopis täiuslikuma pildi kui annaks vaid ühe või teise poole andmed, ning võimaldab hoopis täpsemaid ennustuslikke analüüse.

Teataval määral on see muutunud justkui ka ootuseks, et teatud algoritmid pakukski meile individuaalselt lahendusi erinevates olukordades, raamatuid, mida on lugenud teised sarnaste huvidega inimesed või teaks, mis võiks olla need kohad, mida me Pariisi külastades soovime.

Privaatsus äpi eest

Koos kõigi nende toredate võimalustega jääb alati üles küsimus privaatsusest. Kas privaatsus enam ongi võimalik? Kuidas seda saavutada? Kui me vabatahtlikult erinevaid teenuseid kasutades anname loa ka enda kohta andmeid koguda (ja tihti neid ka kellegagi veel jagada), siis kuidas hiljem tegelikult nende andmete teekonda või erinevaid tegevusi, mida nendega tehakse, kontrollida?

Dirk Helbing viitab oma raamatus "Thinking Ahead – Essays on Big Data, Digital Revolution, and Participatory Market Society" sellele, et tekkimas on uus lähenemine, mille kaudu jõutakse lõpuks selleni, et privaatsus on kaup mida ostetakse – ehk selle eest, et endast mahasalvestunud andmed kustutada või kätte saada, tuleb maksta.

Seejuures tuleb teadvustada, et mida paremaks muutub analüütika, seda suurem on risk privaatsete andmete lekkimisele. Tehnoloogilised edusammud muudavad privaatsete andmete kogumise tavainimese jaoks tihti nähtamatuks. Palju inimesi aga ongi valmis vahetama oma privaatsuse selle vastu, et külastada mõnd veebilehte või kasutada äppi.

Kaduma kippuv kontekst

Suurandmete analüüsi puhul räägitakse paratamatult ka kaduma minna võivast kontekstist. Suurandmed, mis võivad olla semistruktureeritud või struktureerimata nagu on näiteks ka mitmed sotsiaalmeediast kogutavad andmed, vajavad täiesti teistsuguseid tehnikaid ja meetodeid selleks, et analüüsi käigus oleks võimalik kontekst säilitada ning hiljem ei juhtuks, et andmetele omistatakse kontekst, mida selle esialgne omanik üleüldse silmas ei pidanud.

Teatud määral mõjutab seda kindlasti ka fakt, et kui reaalses elus on inimestel võimalik avalik ja privaatne sfäär oma elus lahus hoida, siis ühiskonnas, kus kõik tegevused on muutunud andmeteks, on see sisuliselt võimatu.

Puudub täielik teadmine, kellel ja millel on ligipääs ning inimese profiil, millest lähtuvalt näiteks reklaame pakutakse või teatud eelistusi määratletakse, võib koosneda nii inimese jaoks eraelulistest kui ka tööalastest andmetest.

Toimetaja: Marju Himma



Jõulud ei jäta külmaks ka ERR Novaatorit. Jõuluõhtule eelneval kümnel päeval ilmub iga päev Tarmo Soomere jõulukalendrisse „Dekaad“ uus pühadega haakuv fakt, näpunäide või soovitus. Loo nägemiseks liiguta kursor kuupäevale.

teadustöö õigeusu koolide ajaloost
pinged akadeemilise vabaduse ümber
Tööstusdoktorantuur on doktoriõppe erivorm, kus doktorant teeb teadustööd ettevõttele.

Väljavõtted tippülikoolide nõuetest, kuidas teadlased ühiskonda panustavad

Viimaste päevade tulised sõnavõtud teemal kui palju võib ülikool ette kirjutada, keelata või lubada teadlastel teaduspõhist arvamust või ka uuringid väljaspool ülikooli. Sirp tegi ülevaate erinevate maailma tippülikoolide reeglitest, mis ütlevad, millistel alustel võib teadlane oma tööd ühiskonnale anda. Siit on ehk Eesti ülikoolidelgi palju õppida.

Kust pärines Tšeljabinski meteoor?

Meteoorkehad lõhkevad sissetunginud õhu survel

Kosmosest tuleb Maa peale palju kraami, iga päev umbes 60 tonni kosmilist tolmu ja 10 grammist raskemaid meteoorkehi igal aastal umbes 50 000 tonni. Suuri kehi nagu 2013. aasta Tšeljabinski meteoorkeha langeb Maale õnneks suhteliselt harva. Nüüd selgub aga värskest teadustööst, et Maa atmosfäär kaitseb Maa pinda kosmosekivide eest veel paremini, kui seni arvatud.

ERR kasutab oma veebilehtedel http küpsiseid. Kasutame küpsiseid, et meelde jätta kasutajate eelistused meie sisu lehitsemisel ning kohandada ERRi veebilehti kasutaja huvidele vastavaks. Kolmandad osapooled, nagu sotsiaalmeedia veebilehed, võivad samuti lisada küpsiseid kasutaja brauserisse, kui meie lehtedele on manustatud sisu otse sotsiaalmeediast. Kui jätkate ilma oma lehitsemise seadeid muutmata, tähendab see, et nõustute kõikide ERRi internetilehekülgede küpsiste seadetega.
Hea lugeja, näeme et kasutate vanemat brauseri versiooni või vähelevinud brauserit.

Parema ja terviklikuma kasutajakogemuse tagamiseks soovitame alla laadida uusim versioon mõnest meie toetatud brauserist: