Eesti lahendus vähendab pärisandmete vajadust tehisintellekti treenimisel
Kujutage ette, et peate õpetama tehisintellekti ära tundma midagi väga haruldast, näiteks spetsiifilist sõjatehnikat, millest on vaid käputäis fotosid. Kust leida tuhandeid pilte treeninguks? Eesti teadlaste värske uuring näitab, et vastus võib peituda videomängude maailmas.
Teadustööst selgub, et kui segada väike kogus päris andmeid suure hulga nutikalt loodud sünteetiliste piltidega, tunneb tehisintellekt objekte ära isegi paremini, kui pelgalt päris fotode peal treenitud tehisaru.
Avastuseni jõudsid Eesti kaitsetehnoloogia ettevõtte Defsecintel Solutions ja Tallinna Tehnikaülikooli teadlased eesotsas Walid Remmase ja Martin Lintsiga. Nad töötasid välja arvutimängumootoril Unreal Engine põhineva süsteemi, mis suudab luua masinõppe jaoks ülitäpseid ja mitmekesiseid treeningpilte. See pakub lahendust olukordadeks, kus päris andmeid on vähe või nende kasutamine on privaatsusreeglite tõttu piiratud.
Töörühma analüüs näitas, et parima tulemuse andis eri tüüpi andmete kombineerimine. Kõige paremini töötas tehiaru siis, kui treeningandmetest moodustasid 25 protsenti sünteetilised ja 75 protsenti päris pildid. Tulemus oli viis protsenti parem kui ainult päris andmeid kasutades. Veelgi enam, isegi kui päris andmeid oli vaid kümme protsenti, oli see vaid viiendiku võrra kehvem, kui ainult päris andmetega treenitud mudel.
Teadlasi saatnud edul on lihtne seletus. Peamiselt peitub see kahes uuenduses. Kui varasemad meetodid joonistasid objektide ümber tihti liiga suuri kaste, siis Eesti teadlased paigutasid digitaalsetele mudelitele hoopis pisikesed markerid otse nende nurkadesse, servadesse ja tippudesse. Süsteem lõi tuvastuskasti ainult nähtavate markerite põhjal, mis kindlustas, et tehisintellekt õppis objekti piirjooni tundma millimeetri täpsusega, isegi kui see objekt oli osaliselt varjatud või liigutas oma osi. Hea näide on siinkohal pöörlev tankitorn.
Teiseks muutsid nad arvutis loodud maailma võimalikult mitmekesiseks ja ettearvamatuks. Nad vahetasid pidevalt taustu alates linnadest kuni metsadeni, muutsid ilmaolusid lumest udu ja vihmani ning varieerisid valgustust ja kaameranurki. Selline juhuslikkus sunnib tehisintellekti keskenduma objekti kuju olemusele, mitte niivõrd näiteks tekstuurile või varjudele.
Töö pakub praktilist lahendust valdkondadele, kus andmete kogumine on kallis või keeruline, alates meditsiinist kuni kaitsetööstuseni, vähendades oluliselt vajadust käsitsi märgistatud pärismaailma andmete järele.
Saadud tulemusi kirjeldavad teadlased ajakirjas IEEE Access.
Teadusuudised on Vikerraadios eetris esmaspäevast reedeni ca kell 8.35 ja laupäeval ca kell 8.25.
Toimetaja: Sandra Saar, Jaan-Juhan Oidermaa



















