Mänguteooriat mõistval tehisintellektil tekib inimlik iseloom
Omavahel suhtlevatel tehisintellektidel (TI) ilmnevad inimlikud isikuomadused. Nähtus pole huvitav vaid teoreetiliselt, sest kiiresti paljunevad TI-süsteemid asuvad juba õige pea suhtlema inimeste kõrval ka üksteisega, leiab R2 tehnikakommentaaris Kristjan Port.
Rahvalik kogemus koos hilisema teaduslikuma ja metoodilise tähelepanelikkusega kinnitavad, et varase lapsepõlve sündmustel ja tingimustel on ainulaadne mõju hilisema elu käitumistele. Seda lisaks geenidele. Mõlemad mehhanismid kujundavad ellu jäämist toetavat käitumuslikku paindlikkust.
Geenidega antakse kaasa midagi pikaajalise mälu laadset, kandes õnnestunud paljunemiste kaudu edasi järgmise põlvkonna üleskasvatamist võimaldanud kohanemisi. Oleks võim vaid geenidel, püsiks organism vanaaegse ja suhteliselt kohanemisvõimetuna.
Kaksikute ja pereuuringutega on demonstreeritud geenide mõju inimeste sotsiaalse käitumise osadele nagu empaatia, altruism ja usaldus. Teisalt võivad väärkohtlemine ja varane trauma jätta käitumist kujundavale geenile püsivad epigeneetilised jäljed, millel võib omakorda olla püsiv mõju hilisemale käitumisele ja tervisele. See osutab geenide kõrval varajaste kogemuste olulisele mõjule.
Inimeste käitumisstrateegiaid uuritakse eksperimentaalse sotsiaalse konflikti abstraktsioonina tuntud vangide dilemmaga. Kaks uuritavat inimest on mõttelise kurjategija rollis. Nende ebaõnneks on mõlemad politsei poolt kinni võetud. Kumbagi hoitakse teineteisest eraldi ja nad ei saa omavahel suhelda. Järgneva käitumise strateegia valiku ainus teave rajaneb subjekti olukorra analüüsile. Seda kujundavad varasem kogemus ja iseloomuomadused.
Kummalegi vangile pakutakse sama kokkulepet. Tunnistades egoistlikult teise süüd, pääseb tema vabaks. Süüdijäänut ootab 20-aastane vangistus. Tunnistavad mõlemad teineteise vastu, ootab kumbagi 10-aastane vangistus. Koostöösse lootes hoiavad mõlemad suu kinni, ootab kumbagi ees viieaastane kinni istumine.
Vangidilemma põhjal võib luua erinevaid ja mängulisemalt mugavamaid stsenaariume, milles vangistuse asemel kannatab makstav tasu vmt. Vabatahtlike vanglaga hirmutamine pole ka süütule inimesele kõige adekvaatsem psühholoogiline sekkumine. Sestap on antud olukorda analüüsitud inimeste asemel palju rohkem neid esindavate arvutimudelitega.
Moraalseid dilemmasid lahendanud kümnete tuhandete arvutiagentide abiga on selgunud mitu inimestele olulist asjaolu. Selgub, et ühekordse mängu puhul on kasulikum nn sõber reeta. Kuigi kummagi vaikimine oleks veelgi parem, on suur oht jääda vangi 20 aastaks. Ühekordses mängus ei õpita eriti midagi muud peale ebamoraalsena paistva tatika.
Kui elu pakub sama olukorra üha uuesti, tekib õppimise kogemus. Näiteks võimalus teise osapoole karistamiseks või tunnustamiseks. Parimaks taktikaks on osutunud teise taktika matkimine. Korduv mäng kujundab inimeste pikaajalisi käitumisi tänu teiste mõjutusele.
Elu ongi üks suur mäng, milles kõik peavad teistega arvestama. Olles ise need n-ö teised ülejäänutele. Elu sarnaneb vähemalt osaliselt vangidilemmale. Kahe mängija suhteliselt arusaadava olustiku asemel koosneb elu korduvatest, sadadest teineteist mõjutavate indiviididega mängudest.
Selle tulemusel kujunevad ja muutuvad inimesed kogu oma elu jooksul. Osades ilmnevad ühel hetkel individualistlikumad käitumised, kui teised asuvad hindama koostööd jne. Veelgi pikema aja puhul räägitakse evolutsioonilisest mängust. Selles on panusteks geenide kujunemine.
Arvutis simuleeritud agentidest on praeguseks kasvanud välja tehisintellekt. Jaapani teadlased soovisid selgitada, kas ja kuidas kujunevad koostöö või individualismi tasakaalu nõudva ressursi jagamise mängus TI-agentides iseseisva käitumise püsivad mustrid ehk iseloom pika aja jooksul üha uuesti.
Küsimus pole teoreetiline arvestades, kuidas kiiresti paljunevad TI-süsteemid asuvad juba õige pea suhtlema inimeste kõrval ka omavahel. Inimestel on kõige rohkem probleeme teiste omasuguste käitumise mõistmisega. Nüüd siis peab valmistuma suhtlemiseks iseseisvalt kujunenud iseloomuga tehnilist päritolu kaaslastega.
TI-agentide vangide dilemma stsenaariumi modifikatsioonis oli valida, kas ta teeb oma partneriga koostööd või loobub sellest kaotades või saades virtuaalseid dollareid. Eksperimendi eriti huvitava tahuna võimaldati agentidel luua uusi põlvkondi, millele rakendati looduslikku valikut. Iseka ja koostööalti käitumise dilemmade kordumise ning neist õppimise tulemusel hakkasid ilmnema inimesega sarnased isiksuseomadused.
Nagu võib kohata tänapäeva inimeste seas, kujunesid mõnest agendist isekad tüübid, kes asetasid oma huvid kõrgemale kogukonna või rühma kui terviku huvidest. Halvad elavad tänu piisava hulga heade ja mugavust eelistavate olemasolule. Sellele vihjab teiste agentide perekondades keerulisemate strateegiliste käitumiste kujunemine, mis püüdsid isikliku kasu nimel arvestada vastastikuse ja kollektiivse kasuga.
Teadlased märkisid mõningase murelikkusega, et eksperimendi TI-agentide kogukonnad olid ebastabiilsed, kui ülemäära koostööaltid rühmad asendati egotsentrilisemate agentidega. Teadlased oleksid võinud ju lugeda uudiseid maailma poliitikast ja nad poleks sugugi üllatunud.
Esmaspäevast neljapäevani võib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2 saates "Portaal".
Toimetaja: Jaan-Juhan Oidermaa
Allikas: "Portaal"