Ühismeediast kohatu sisu eemaldamine pakub tehisintellektile parajat pähklit
Ühismeedia ajastul tuleb aina enam mõelda, kuidas kaitsta lapsi ja noori, aga ka kõiki teisi kasutajaid vägivalda, vihakõne ja pornograafiat sisaldava sisu eest. Kuigi ebasobilikku sisu tuvastavad algoritmid muutuvad järjest tõhusamaks, jätkub endiselt kitsaskohti, millele teadlased lahendusi otsivad.
Kui internet 1990. aastatel laialt kättesaadavaks sai, muutus laste ja noorte jaoks mittesobiv sisu hõlpsasti kättesaadavaks. Probleemi aitasid ohjeldada veebilehitsejate turvarežiimid, mis blokeerivad ligipääsu problemaatilistele lehekülgedele. Sotsiaalmeedia tulekuga muutus olukord keerulisemaks.
"Ühtäkki oli sadu tuhandeid kasutajaid, kes laadisid üles miljoneid fotosid ja videoid. Sellel kõigel järge pidada, nii et kõige muu vahele ei satuks ebasobilikku sisu, on paras väljakutse," ütles Gholamreza 'Shahab' Anbarjafari, Tartu Ülikooli tehnoloogiainstituudi professor ja seal tegutseva masinnägemise töörühma iCV juhataja.
Suurtel meediaettevõtetel on terved meeskonnad, kes töötavad välja algoritme, mis peaks ebasobilikku sisu blokeerima. Lisaks saavad kasutajad sellest ise teada anda. Kui seda teeb piisav hulk inimesi, blokeeritakse sisu automaatselt. "Võib ka juhtuda, et raporteerijad ise on pahatahtlikud ja tahavad mingil põhjusel kasutajat blokeerida. Postituse uuesti avalikuks tegemine eeldab inimese sekkumist, see võtab aega ja ei ole väga lihtne," ütles Anbarjafari.
Alastipiltide tuvastamine
Platvormid nagu Youtube kasutavad muu hulgas tuvastussüsteemi, mis arvutab, kui suur osa kehapinnast on katmata. Seejuures saab algoritm aru, kui fookuses on üksnes inimese nägu.
Professori sõnul on sellisel lähenemisel mitu puudujääki, sest algoritm ei pruugi ära tunda juhtumeid, kus näiteks niigi nappide rannarõivaste värvus sarnaneb naha omaga: "Selle tulemusel blokeeris süsteem pilte, milles ei olnud ebasobilikku sisu. Suurem mure oli sellega, et algoritm ei suutnud tuvastada taustal olevaid ebatsensuurseid pilte. Lisaks võis juhtuda, et algoritm filtreeris välja asju ja objekte, pidades neid ekslikult intiimkehaosadeks."
Ta lisas, et iseäranis keerulised on juhtumid, kus alastushetk peidetakse muidu korrektse video sisse. Näiteks võib olla 20-sekundiline video, mis sisaldab poole sekundi jagu ebasobivat sisu. "Sedalaadi video võib üleval rippuda päris kaua, enne kui suurem hulk kasutajaid sellest raporteerib," kommenteeris professor.
Eetiline tehisintellekt
Koos kolleegidega arendab professor Shahab Tartu Ülikooli masinnägemise laboris eetilist ja vastutustundlikku tehisintellekti. Töörühma üks eesmärk on välja töötada algoritm, mis tuvastab alastipilte, analüüsides pildi juurde lisatud kommentaare. "Eesmärk on kombineerida visuaalset ja tekstilist sisu. See algoritm otsib kommentaaridest ühiseid mustreid. Kui need muutuvad negatiivseks, siis ebasobilik osa pildist hägustatakse," rääkis professor Shahab.
Automaatse hägustamise algoritm kasutab liigitamise võrgustikust saadud informatsiooni ega vaja lisasildistamist või täiendavat treenimist. Kuna kasutajate kommentaaride lisandumine võtab aega, saab postitus siiski mõnda aega üleval olla.
Omaette küsimus on, kuidas üldse kindlaks teha, mis punktist alates on postitatud pilt või tekst ebasobilik. "Tehisintellekti treenimise juures võtame arvesse parasjagu kehtivat ühiskondlikku normi. Näiteks mikrobikiinide puhul annab meie algoritm hoiatuse, nii et inimene peab sekkuma ja otsustama, kas see on sobilik," arutles professor.
Ta lisas, et tsenseerivate algoritmide välja töötamisel tuleb leida hea tasakaal. Kui need on liiga ranged, siis filtreeritakse paratamatult välja ka üksjagu palju süütut sisu, näiteks tavalisi rannafotosid.