Anonüümsete trenniandmete avalikustamine reetis USA sõjaväebaaside asukoha
Masinõpe võib muuta ohtlikuks isegi kõige süütumad toorandmed. Anonüümsete trenniandmete kogumisega leiba teeniv Strava paljastas tahtmatult Afganistani ja Süüria kõrbemaastikul asuvad USA sõjaväebaasid, vahendab R2 tehnikakommentaaris Kristjan Port.
Iga tegevus kutsub esile muutuseid. Iga muutus kujutab endast aega maha jäetud jälge. Ja iga jälge võib käsitleda kui andmeühikut. Järelikult tekitavad tegevused andmeid. Oleme inimkonna arenguloos saavutanud oskustaseme, mis võimaldab paremini kui eales andmeid koguda, talletada, edastada ja analüüsida. Peame ühtesid andmeid väärtuselt madalateks ja teistest hoolime rohkem. Väärtus tuleneb andmete tähendusest ehk hetkest, kui neile lisada kontekst. Näiteks on raske hinnata kuuekohalist numbrijada väärtuslikuks, kui ei teaks, et need loto peavõidu toonud numbrid.
Seega, kui jooksed mööda liivavälja, tekitab iga sinu samm hulganisti andmeid, millest osa suudavad kaasaegsed vahendid nagu sammulugeja, aktiivsusmonitor või telefon kohe registreerida. Esialgu on hunnik arve samas vääringus talla all krudisevate liivateradega. Need ei lisa sinu elu midagi uut. Tead isegi, et jooksed või kõnnid, kus oled ja kuidas end tunned. Ometi neid andmeid kogutakse, sest hulk hakkab ise väärtust looma.
Näiteks saad võrrelda päevade kaupa, kui palju oled jooksnud, energiat kulutanud, kuidas ja kas keha on treeninguga harjunud jne. Madala väärtusega andemete kogumisest on saanud omaette tööstusharu. Kui neid nagunii tekib ja andmete kogumisega saab nende informatiivset väärtust tõsta, siis järelikult on olemas turg andmete kogumise tehnoloogiatele. Kuna lihtne loogika ütleb, et andmete väärtus peab ületama nende kogumiseks tehtavaid kulutusi, siis viitab sugugi mitte kõige odavamate seadmete äri õitsemine viitab saadavale kasule.
Vahest kõige kiiremini levis eluepisoodide pildistamise tehnoloogia, mille varjus lisandub kaasaegsete inimeste kandamisse kehalist aktiivsust koguv tehnoloogia, olgu siis kas telefonifunktsiooni või eraldi seadmena. Elust sündivate andmete vääristamise loomuliku arenguteena on uute sensorite lisandumine, mille tulemusel saaks võimalikult palju andmeallikaid kombineerides veelgi rohkem kasu.
Suures pildis tärkavatest märksõnadest kajastavad seda maailma suurandmed ja masinõppimine. Pole siis ime, mida kõike kaasaegsed kantavad seadmed kokku ei korja. Lisaks kehaga sooritatava töö kohta kogutavale kuhjuvad andmed unest, norskamisest, südame tööd iseloomustavatest tahkudest, kehatemperatuurist, hingamisest, ravimite võtmisest, asukohast jne.
Andmeid võib võrrelda radioaktiivse materjaliga. Väga ohtlikku ainest püütakse hästi kaitsta. Samas sünnib andmeid, mida võib võrrelda loodusliku madala radioaktiivsusega taustakiirgusega. Need on ohutud ega tee midagi. Paraku võib seda materjali kontsentreerida, lisada tähenduse ja siis võib neil olla kontekstist sõltuvalt ootamatult suur väärtus. Näiteks sündis mõni aasta tagasi mitmes peres piinlik olukord, kui avalikku ruumi kogunenud aktiivsusmonitori andmetest sai välja lugeda seda, kas andmete tekitaja tegi trenni või viibis armukese seltsis.
Alates möödunud nädalavahetusest avastas maailma sõjakam osa kehalist aktiivsust kajastavate andmete eluohtlikuma väärtuse, kui sportlaste ja liikumishuviliste seas populaarne treeningu andmete kogumise võrgustik Strava avalikustas umbes miljardi anonüümse trennikorra andmed.
Firma poolt vaadatuna aitab selline ülevaade kasutajaid motiveerida ja uusi kasutajaid aktiveerida ning samas näidata, kus saab trenni teha. Näiteks tutvustades suure populaarsusega või kellelegi teisele sobivalt just väheste kasutajatega trennipaiku. Näiliselt ohutud andmed riputati välja kolm kuud tagasi.
Suus tabas aga keegi nendes peituva uue väärtusena, et Strava treeningkaartidel joonistuvad välja näiteks enamus USA sõjaväebaasidest, sealhulgas konfliktipiirkondades. Keset Süüria või Afganistani kõrbemaastikku hõõguvad rindel olevate baaside kontuurid, mida joonistavad seal treenivad sõjaväelased tahtmatult oma sammudega maailmakaardile. Samal ajal Süüria Assadi armee või islamiradikaalide jõugud trenni ei tee ega andmeid kogu. Seetõttu neid pole Strava kaartidel näha.
Harjumuspäraselt mürarikkas uudisvoos võib pidada sedagi juhtumit väikese väärtusega infopalaks. Samas peaks analoogseid andmete leviku ja kogunemisega seotud juhtumeid kogudes sündima mõni väärtuslik üldistus. Näiteks mõtlema andmetele nagu mikroobidele. Viimaste suhtes kujunesid umbes 150 aastaga hügieenireeglid. Loodetavasti suudame saada andmehügieeni vallas targaks vähemate ohvritega.
Esmaspäevast neljapäevani võib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2 saates Portaal.
Toimetaja: Jaan-Juhan Oidermaa
Allikas: "Portaal"