Kristjan Port: tehisintellekt võitis maailma pokkeriässi

Eelmisel nädalal levisid uudised inimestest mängureid võitnud pokkerit mängivast masinast. Miks peaks sellele uudisele tähelepanu pöörama?
Keda huvitab järjekordne teadaanne masinale kaotanud inimesest, kui kõik on kuulnud male maailmameistri kaotusest arvutile? Hiljuti räägiti palju go-mängus maailma parima inimesest mängija troonilt tõuganud seadmest, vahepeal võitis arvuti mälumängureid telerivaatajate seas populaarses viktoriinis "Jeopardy" jne? Vastus peitub pokkeri mängu iseloomus.
Mälumängus pead teadma fakte. Arvutil on hea mälu, kuhu mahuvad kõik maailma raamatukogud koos teatmeteostega. Males ja go-mängus allub tegevus kindlatele reeglitele ning võitmise võti peitub õige strateegia ja taktika valikus ning teostamises oponendi vastutegevuse tingimustes. See, kas neis mängudes teeb mõni osapool nägusid või mitte, eriti selle kulgu ei mõjuta, sest kogu vajalik informatsioon asub laual. Isegi kui osapooled ei tea vastase järgmist käiku, teavad nad, millised käigud on võimalikud. Mänguteoorias öeldakse, et tegemist on täiusliku informatsiooniga. Probleemiks kujuneb selle haldamise võime.
Arvutil on sellises olukorras inimesega võrreldes eeliseid. Inimene ei analüüsi kõiki käike läbi, sest osa neist on ilmselt eos rumalad ja inimene on tark. Kuid ta väsib ja tal võib kogemusest hoolimata jääda õige käik valimata. Arvuti suudab kiiresti läbi mängida miljoneid kombinatsioone ja valib nendest mõne huvitavama, kavandades samal ajal mitmeid erinevaid jätke
Go-mängus inimest võitnud arvutis elutsevale tarkvarale oli kasutada reaalsete inimeste mängitud mängude kulg ja mängis lisaks taktikate arendamiseks iseendaga lugematuid partiisid. Arvuti trumpas inimest hästi koolitatud ja viimistletud, kuid ikkagi toore jõuga etteantud reeglitega loodud käigukombinatsioonide maailmas.
Pokkeris on samuti reeglid. Kaartide arv ja sisu on ette teada. Ainult, et mängija ei tea vastaste kaarte. Siin lisandub mängu psühholoogiline aspekt, mille eesmärgiks on reaalsuse moonutamine. Omamoodi on lubatud petmine kuni selle piirini, milles kaart tuleb käisest vmt. Olukorda, milles hoiab mängija osa informatsiooni saladuses või tema antud info ei ole usaldusväärne, tuntakse mittetäiusliku informatsiooniga mänguna. Nendes mängudes on inimesel olnud eelis, kuna oskab omasuguseid lugeda, et neid petta ja bluffida.
Carnegie Melloni ülikoolis loodud superarvutil töötav tarkvara Libratus mängis nelja maailma profimängijate tipp-pokkeriässaga 20 päeva kestnud turniiril. Kõrgete ja piiramata panustega Texas Hold`em mängudes tuli arvuti võitjaks ja teenis 1,7 miljoni dollari eest žetoone. Esialgu ei erine Libratus eelmisel aastal go-d mänginud arvutist, sest seegi õppis pokkerit tundma ise endaga lõputuid mänge mängides. Masinale omaselt ei läinud see pärast 11 tundi kestnud mängupäeva magama, vaid siis, kui inimestest vastased nägid mängust und, analüüsis Libratus vastaste mängu ja mänguviise.
Kogemustega pokkerimängijatele tuli Libratuse hea mänguoskus üllatusena. Arusaadavalt olid nad arvestanud, et arvutile pole keeruline tõenäosusteooria rakendamine mängus nähtavale tulnud kaardikombinatsioonide hindamisel, ent neid segas masina inimlik pool. Õigemini tundus neile, nagu näeks Libratus nende kaarte.
Peast käis läbi ka blufi võimalus. Tõenäoliselt oli tegemist inimese enda natuuri peegeldusega, sest tarkvaraloojad lükkasid kõik need oletused ümber. Nad kinnitasid, et antud lahenduses tarkvara inimeste ilmeid ei analüüsinud ega püüdnud bluffida. Kuid võibolla bluffisid seekord tarkvara loojad?
Igal juhul toob see juhtum esile uue kvaliteediga probleemi. Oleme arvestanud, et arvuti täidab inimese käske, ent kuidas sa tead, et see ei blufi? Kust sa tead, et arvuti ei jälgi ega analüüsi sinu näos kõige väiksemaid muutuseid, tabamaks nõrka kaardikätt või mõnda muud sulle ebasoodsat asjade seisu, näiteks ettevõtjate või riikide vahelistel läbirääkimistel? Kui sul tulevikus sellist arvutit ei ole, võid osutuda suures pokkerimängus kaotajaks. Kui kõigil on selline arvuti, pole sind vist enam vaja.
Esmaspäevast neljapäevani võib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2 saates Portaal.
Toimetaja: Jaan-Juhan Oidermaa
Allikas: Portaal