Professor: tehisaru ei oska öelda, et ta ei tea
Tehisaru pakub sageli küsimustele vastuseid, mis ei vasta tõele. See aga ei tule pahatahtlikkusest, vaid süsteem teeb oletusi, tuginedes tõenäosusele.
Tartu Ülikooli arvutiteaduse instituudi tehisintellekti professor Meelis Kull selgitas "Terevisioonis", et tehisintellekt ei mõtle ega tea asju samamoodi nagu inimene. Selle asemel töötab keelemudel statistikaga: iga sisendtekst tükeldatakse väikesteks osadeks, mis muudetakse numbriteks. Seejärel ennustab mudel nende numbrite põhjal, milline sõna või fraas võiks statistiliselt kõige tõenäolisemalt järgmisena tulla. "Hiigelsuur tehisnärvivõrk annab siis lõpuks tulemuse," rääkis Kull.
Teksti arvudesse ümber kodeerides jooksutakse lihtsat koodide teoorial põhinevat algoritmi, mis tõhusalt teavet arvudesse ümber kodeerib. "Põhiline nutikus tuleb närvivõrgust, mis nende arvudega hakkab opereerima," ütles ta.
Kui küsida näiteks ChatGPT käest: "Mis su nimi on?", siis kõige sagedasem järg on "Minu nimi on..." Mudel lihtsalt jätkab teksti vastavalt sellele, mis mustrid on treeningandmetes olnud kõige sagedasemad, selgitas Kull.
Seetõttu võib sama küsimus anda erinevatel kordadel erinevaid vastuseid ja seega on juhuslikkuse element süsteemi sisse ehitatud. Nii tekibki olukordi, kus vastuse asemel pakub tehisintellekt midagi näiliselt loogilist, kuid faktiliselt valet.
Probleem süveneb, kui küsimus puudutab kitsamat kultuurilist nähtust või kohalikku teemat. Saatejuht tõi näite laulust "Roosiaia kuninganna", mille esitaja on Anne Veski, kuid tehisaru väidab, et tegemist on hoopis muusikalinumbriga, mis põhineb Marie Underi romaanil ja mille lavastasid väljamõeldud isikud.
"Kui mudel ei tea vastust, siis meie ootaks, et ta ütleks lihtsalt, et ta ei tea. Keelemudelite arhitektuur ei toeta aga seda hästi. Sellist fraasi esineb treeningandmetes harva, mistõttu mudel pole harjunud seda kasutama," nentis Kull.
Keelemudelite usaldusväärsuse küsimus on Kulli sõnul keskne nii teadustöös kui ka praktilistes rakendustes. Nende sisemine mehhanism ongi määratud eksima, eriti siis, kui puudub piisav andmebaas või kontekst. See ei tähenda samas, et tehnoloogiat ei saaks paremaks muuta. "Lahendus on kombineeritud süsteemides, kus keelemudelit toetavad muud tarkvaralised kihid, mis aitavad tuvastada ebatäpsusi ja suunata vastuseid," ütleb Kull.
Kokkuvõttes ei tasu tehisaru eksimusi tõlgendada tema hinnangul pahatahtlikkuse või valelikkusena. Mudel ei püüa valetada, vaid teeb oletusi, tuginedes tõenäosustele.
Toimetaja: Sandra Saar
Allikas: "Terevisioon", küsis Reimo Sildvee