Minutiloeng: kuidas tehisaru humanitaare aidata saab?
Tehisintellekti tehnoloogiad panevad tööle praktiliste kasutusvõimalustega juturobotid, kuid võimaldavad samas automatiseerida ka teadustööd. Tallinna Ülikooli kultuuriandmete analüüsi teadur Andres Karjus näitlikustab värskes minutiloengus, kuidas saab tehisaru aidata humanitaare.
Praegu on humanitaarias põnevad ajad, ning seda sellepärast, et tehisintellekti rakendusi on mitmeid. Nüüdseks on ilmselt kõik tuttavaks saanud erinevate jutu- ehk tekstirobotitega nagu ChatGPT või Copilot. Need on kasulikud kirjutamisabilised, millega saab ka tekste kokku võtta või ümber sõnastada. Humanitaarteadlastele on aga palju põnevamad suured keelemudelid, mille toel needsamad praegused juturobotid jooksevad.
Tegemist on masinõppe mudelitega, millega saab väikse vaevaga automatiseerida suurel skaalal igasuguseid analüütilisi ülesandeid. Varem sai seda teha juhendatud (supervised) masinõppe kaudu, aga varem pidi iga variaabli, küsimuse või hüpoteesi jaoks kohandama või treenima eraldi mudeli. See omakorda vajas suures koguses inimeste märgendatud treeningandmeid.
Automaatselt analüüsimine või andmete klassifitseerimine suurte keelemudelitega on oluliselt lihtsam, sest neid saab lihtsalt instrueerida – anda ette juhend, mis põhineb teadlase ekspertteadmistel, analüüsitav näide, ja nii lihtsalt iteratiivselt "küsida" iga andmeühiku ja tunnuse kohta, kuni andmehulk on läbi analüüsitud. Nagu juba mitmetes teaduslikes artiklites on praeguseks näidatud, toimib see kohati juba päris hästi.
Seega tasub mõelda, millised on sellised ülesanded, mida varem tehti kas ise või anti tudengitele ja teadusassistentidele käsitsi tegemiseks – nüüd saab neid tõenäoliselt delegeerida ka tehisintellektile. Sel puhul peab lihtsalt olema natuke ettevaatlik: arvestama võimalike mudeli kallutatustega; vaatama, kas mudel konkreetse ülesande ja keele peal hästi toimib, ning arvestama ennustustäpsuse või veaprotsendiga saadud andmehulkade edasisel statistilisel modelleerimisel.
Kokkuvõttes on nüüd põhimõtteliselt võimalik teha suurte andmehulkadega uuringuid, mida siiani on võib-olla harjutud tegema väiksemal skaalal – potentsiaal on siin arvestatav ja praegune aeg väga huvitav.
Toimetaja: Jaan-Juhan Oidermaa