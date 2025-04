Varem treenisid inimesed TI-d eelnevalt salvestatud mänguvideote põhjal. Uus süsteem, Dreamer, suutis jõuda mängu ühe raskemat sorti ja mitmeetapilise ülesande lahendamiseni ilma, et sellele oleks õpetatud, kuidas mängida, vahendab Nature.

Süsteemi loonud teadlaste sõnul on Dreameri võime õppida ning kasutada õpitut uutes olukordades, on tehisintellekti arendamises oluline samm edasi. "Dreamer tähistab olulist edasiminekut laiade TI-süsteemide suunas," sõnas Google'i Deepmindi teadlane Danijar Hafne. Teadlane lisas, et see võimaldab TI-l seda ümbritsevast keskkonnast aru saada ning ennast aja jooksul täiustada ilma, et inimene peaks talle täpselt ütlema, mida teha.

Minecraft kui TI testimisvahend

Minecraft on tuntud oma avatud ja juhuslikult genereeritud maailmade poolest. Mängijad saavad seal avastada erinevaid keskkondi, koguda ressursse ning valmistada esemeid. Teadlaste hinnangul on see TI proovile panekuks ideaalne, kuna mängus ei tule ette kahte täpselt ühesugust olukorda.

Teemantide kogumine on Minecraftis keeruline ja pikaajaline protsess, mis nõuab mitmeid vahe-etappe nagu puidu kogumist, tööriistade meisterdamist ja maa-aluste koobaste uurimist. Dreamer õppis eesmärgi saavutamist iseseisvalt. See tähendab, et süsteem katsetas erinevaid tegevusi, jättis meelde kasulikud strateegiad ning loobus ebatõhusatest valikutest.

Dreameri edu peitub selle võimes ehitada oma keskkonnast nn maailmamudel, mis võimaldab tal ette kujutada tulevasi stsenaariume ning teha otsuseid ilma, et kõik võimalused peaksid olema läbi proovitud. Maailmamudel varustab TI-d võimega ennustada, milline tulevik välja näeb. Teadlaste hinnangul võib see lähenemine olla kasulik ka päris maailmas, kus katse-eksituse meetod on palju kulukam kui videomängudes.

Teemantide test ja tulevikueesmärgid

Teadlased otsustasid testida Dreameri võimekust teemantide kogumisel, andes süsteemile vahepreemiaid iga sammu eest, mis viis selle teemanti leidmisele lähemale. Meeskond lähtestas mängu iga 30 minuti järel, et TI ei harjuks ühe kindla maailmaga, vaid õpiks üldisemad reeglid, kuidas preemiani jõuda. Sel meetodil õppis Dreamer teemante koguma üheksa päevaga. Võrdlusena kulub kogenud inimmängijatel teemantide hankimiseks keskmiselt 20–30 minutit.

Ehkki teemantide kogumine on suur saavutus, viitavad teadlased, et järgmine suur eesmärk on Minecrafti lõppvaenlase, Ender Draakoni, alistamine. See tähendaks nende sõnul uut taset TI võimekuses õppida iseseisvalt keerulistes ja dünaamilistes keskkondades.

Uuring Dreameri kohta avaldati teadusajakirjas Nature.