Teksti uuriv algoritm ähvardab sõnavabadust ja isikupäraseid e-kirju ({{commentsTotal}})

Sõnade esinemissageduse ja lauseehituse põhjal saab öelda nii mõndagi kirja autori kohta.
Sõnade esinemissageduse ja lauseehituse põhjal saab öelda nii mõndagi kirja autori kohta. Autor/allikas: Lue Hang/Creative Commons

Inimestel pole oma harjumustest pääsu, vajutades oma sõrmejälje isegi napisõnalistele e-kirjadele. Briti teadlased esitlevad nüüd algoritmi, mis võimaldab tuvastada selle alusel isikuid 95-protsendise täpsusega. Paraku ähvardab see valedesse kätesse sattudes hakata riivama ka inimeste põhivabadusi, nendib R2 tehnikakommentaaris Kristjan Port.

Öeldakse, et inimene on oma harjumuste vang. See olevat vangla, mille uks on pärani valla. Seal hoitav vang ei soovi aga millegipärast vabadusse. Tõenäoliselt ei tajugi ta harjumuste vangiks olemist. Seetõttu jääb märkamata ka pääsemisvõimalus. On ju enamus harjumusi omanikule märkamatud. Need moodustavad osa tema igapäevasest elust, käitumismustritest, liigutustest ja nii räägitud kui ka kirjutatud sõnadest.

Tegemist pole halvaks peetava taagaga. Paljud harjumused on kasulikud. Osad on seotud näiteks enda ohutuse tagamisega, kui vaatame tänavale astudes automaatselt vasakule. Seda juhul, kui me ei astu tänavale näiteks vasakpoolse liiklusega Londonis. Sealsed inimesed on harjunud vaatama paremale. Sotsiaalses suhtluses on kasulik ja isegi vajalik omada teatud ainulaadset identiteeti. Sinu väikesed iseärasused teevad sind sõprade jaoks tuttavlikult mõnusaks. Võõramate jaoks aitavad need sind teistest eristada ja meelde jätta.

Paraku võivad harjumused sattuda konflikti inimese heaoluga. Halbadest harjumustest leiab palju näiteid. Nendest loobumise raskustest kõneleb seegi, et enamasti on inimene ise neist teadlik. Seda tihti tänu teiste poolsele tähelepanule. Õnnetuseks pole neist vabanemine lihtne. Mõnikord paistab lausa võimatuna.

Samuti on lihtne ära tunda indiviide nende harjumuspärase ülevalpidamise läbi. Näiteks moodustuvad sarnaste väärtustega inimesed sotsiaalseid rühmi, millega kaasnevad teatud automaatsed käitumistavad ja eneseväljendusviisid. Neile paistavad "võõrad" kergelt silma. Isegi kui viimased püüavad oma päritolu varjata näiteks riietumise või räägitava sisuga. Taolised olukorrad tulevad esile võõra rahva seas. Olgu selle määratluseks kas rahvuse või sotsiaalse klassi tunnused.

Seega võivad mõnikord inimest identifitseerivad harjumused kahjustada tema huve. Üheks lahenduseks on anonüümsus ehk deindividualiseerimine. Näiteks soovivad inimesed öelda aeg-ajalt teistele midagi ilma oma identiteedita. Isikuga sidumine võib muuta sõnumi mõtet. Seda võidakse mitte uskuda, seetõttu võib ütleja ohtu sattuda vmt. Arusaadavalt võimaldab isiku info puudumine vältida vastutust olukordades, milles põhjustatakse sõnumiga teistele halba.

Seega on anonüümsusel omad hüved ja pahed. Nendevaheline tasakaal määrab ära, kuivõrd talub kogukond sellist identiteedi varjamist. Tasakaalu kõigutavad nii inimeste teod kui isiku väljaselgitamist võimaldavate teadmiste ja vajaliku tehnoloogilise võimekuse areng. Näiteks inimese tähelepanuga võrreldes detaile kirjeldavate andmete töötlemisel osavama masinõppimise areng.

Hiljuti demonstreerisid Nottingham Trenti ülikooli teadlased teksti uurivat algoritmilist tehnikat, millega analüüsiti erinevate inimeste kirjutatud e-kirjade sõnu. Masin ei saa aru kirja sõnumist, nagu teevad seda inimesed. Masin keskendub sõnadele endile, mis on omakorda inimesele harjumatu. Eri päritolu tekste uurides õppis masin eristama kirjade autoreid teatud sõnade esinemise põhjal. Analoogiana võib tuua sõrmejälje, milles on vaod ja kurrud kõigile ühised. Nende paigutus ja esinemine individuaalne.

Hoolimata sellest, et e-kirjade eneseväljenduse viis erineb tavavestlusest ja pikemast tekstist lühikestele ja kirjast välja jäävat konteksti nägemata, tihti arusaamatutele lausenditele. Ometi õnnestus masinal taoliseid kirju lugedes tuvastada kirjade autor 95-protsendise täpsusega Käesoleval juhul oli autoreid kõigest 12 ja kirjades teksti kokku umbes tuhande sõna jagu. Huvitavaks on aga teksti päritolu.

Need kirjad kuulusid USA kurikuulsa pankrotistunud energiahiiu Enroni töötajatele, mis avalikustati kohtuloo tõttu. Nottinghami ülikooli teadlasi eesmärgiks ongi rakendada loodavat tööriista õigusmõistjate teenistusse. Paraku peame arvestama ka sellega, et sellega kasvab võimekus kahjustada inimeste õigusi. Harjumuspärasest eneseväljendusest on saamas seega modernne sotsiaalne infolõhn, mis saadab ja aeg-ajalt reedab meid uudses interneti džunglis.

Esmaspäevast neljapäevani võib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2 saates Portaal.

Toimetaja: Jaan-Juhan Oidermaa

Allikas: "Portaal"



Nakatumine HPV-ga võib seostuda kasvajate tekkega

HPV vaktsiinist: ausalt ja emotsioonideta

Järgmisest aastast saavad Eesti tütarlapsed vaktsineerida end tasuta inimese papilloomiviiruse vastu. Sõltuvalt vaktsineeritute arvust on võimalik sellega nende eluea jooksul hoida ära kümneid surmaga lõppevaid vähijuhtumeid. Teaduspõhise otsuse kasulikku mõju ähvardavad aga ühismeedias kriitikameeleta jagatavad postitused.

ERR kasutab oma veebilehtedel http küpsiseid. Kasutame küpsiseid, et meelde jätta kasutajate eelistused meie sisu lehitsemisel ning kohandada ERRi veebilehti kasutaja huvidele vastavaks. Kolmandad osapooled, nagu sotsiaalmeedia veebilehed, võivad samuti lisada küpsiseid kasutaja brauserisse, kui meie lehtedele on manustatud sisu otse sotsiaalmeediast. Kui jätkate ilma oma lehitsemise seadeid muutmata, tähendab see, et nõustute kõikide ERRi internetilehekülgede küpsiste seadetega.
Hea lugeja, näeme et kasutate vanemat brauseri versiooni või vähelevinud brauserit.

Parema ja terviklikuma kasutajakogemuse tagamiseks soovitame alla laadida uusim versioon mõnest meie toetatud brauserist: