Õppiv algoritm kaldub sürrealismile

Internetihiid Google on panustanud juba aastaid õppimisvõimeliste masinnägemisega täiendatud algoritmide arendamisse, mis suudavad tuvastada näiteks hooneid, inimesi ja kasse. Ettevõte insenerid on nüüd üritanud aimu saada sellest, kuidas täpselt iga objekte klassifitseeriv neuronivõrgu kiht selle käigus analüüsitava pildi detaile esile toob ja töötleb.
Pilte analüüsivad algoritmid toimivad suuresti nagu inimsilm ja/või aju, otsides visuaalkujul olevast teabest mustreid ja kujundeid, liikudes samal ajal järjest suuremate abstraktsioonide suunas. Näiteks võib esimene neuronite kiht tõsta esile pildi erinevate osade heleduse, järgmine tekstuuri, kolmas leida eelneva põhjal objektide piirjooned kuni selleni välja, et algoritm tuvastab pildil näiteks teravad kõrvad, piklikud pupillid ja vurrud ning järeldab, et tegu on tõenäoliselt kassiga. Tüüpiline neuronivõrk koosneb 10-30 erinevast kihist.
Tehisintellekti treenitakse miljonite piltidega, muutes aeglaselt parameetreid, mille alusel pildi analüüs toimub, kuni algoritm jõuab juba tuntud objektide puhul õige tulemuseni ning ei aja enam omavahel sassi näiteks ilvest, koera ja kassi. Algoritmi kohandamisel tuleb aga kasuks, kui programmeerijad teavad selgelt, mida üks või teine neuronite kiht parasjagu oluliseks peab.
Google'i insenerid andsid selleks nende poolt kasutatud algoritmile käsu pildi parasjagu analüüsitavaid osi eriliselt rõhutada ja esitada analüüsi vaheetappe graafilisel viisil. Lõpptulemus ei jää palju alla tänaseks klassikuteks saanud sürrealistide töödele. Samas näitlikustavad fotod, et hea tahtmise korral on võimalik isegi valges müras märgata banaane, tasse ja sipelgaid, rääkimata loomakujulistest pilvedest.
Toimetaja: Jaan-Juhan Oidermaa