Arvuti pidi pokkerimängus tippudele alla vanduma

Males ja kabes pole isegi maailma suurmeistritel lootust nutikaid arvutiprogramme järjepidevalt lüüa. Suuremat juhuslikkust hõlmavates mängudes nagu bridž ja pokker jäävad algoritmid aga hätta. Arvuti pidi inimestele alla vanduma ka kaks nädalat kestnud maailma paremikku kuuluvaid pokkerimängijaid hõlmanud turniiril. Ent inimeste võit polnud seekord statistiliselt oluline.
Carnegie Melloni ülikooli arvutiteadlase Tuomas Sandholmi juhtimisel loodud programmi Claudico eelkäija Tartanian7 oli edestanud eelneval arvutite vahelisel võistlusel otsustavalt kõiki teisi algoritme. Toonase algoritmi optimeerimiseks ja võimalikult paljude lõpptulemite ennustamiseks kasutati superarvuteid, mille töömälu ulatus kokku 16 terabaidini. Programmi enda suurus jäi pärast seda kahe terabaidi piirile.
Ent kuna pokkeri näol on tegu mänguga, mille mängijatel pole kogu vajalikku informatsiooni käepärast ja seda saab mängida väga paljudel viisidel, jäi isegi sellest mängu klassikalises mõttes lahendamiseks vajaka.
Claudico võimete proovile panemiseks värvati neli professionaalset pokkerimängijat, keda peetakse piiramata panustega üks ühele mängus maailma tippudeks. Bjorn Li, Doug Polk, Dong Kim ja Jason Les mängisid arvuti vastu kahe nädala vältel kokku 80 000 kätt. Teadusliku lisaväärtuse loomiseks said arvutile jagatud käega mängida hiljem ka inimesed.
Turniiri lõpuks oli arvuti kaotanud kolmele mängijale kokku 813 195 dollarit mänguraha. Programmi loojate sõnul ei võimalda see aga üheselt inimeste või arvuti paremust tõestada. Turniiri vältel panustati kokku 170 miljonit, misläbi moodustab võidusumma sellest umbes 0,5 protsenti.
Arvuti vastu mänginud profid, kes jagasid 100 000 dollari suurust auhinnafondi, märgivad, et Claudico üldine mängustiil on hea, kuid algoritm teeb aeg-ajalt arusaamatuid otsuseid.
Selle aasta jaanuaris vähemalt üks-ühele piiratud panustega Texas Hold'em-i mängus võitmatut algoritmi esitlenud Michael Bowling leiab seevastu, et tulemus näitlikustab taas, kui suuri edusamme on tehisintellekti loomise vallas viimasel ajal tehtud. „Julgen ennustada, et kahe-kolme aasta pärast edestavad arvuti algoritmid ka piiramata panustega pokkerimängus tihti maailma tippe,“ mõtiskles Bowling.
Teadlased loodavad, et pokkeris silmapaistvate algoritmide loomisest sünnib praktiline kasu. Analoogseid olukordi, kus otsuse langetajal pole kogu vajalikku informatsiooni ja valida tuleb parim võimalik lahendus, leiab tihti ka päriselust. Näiteks aitaksid sarnased algoritmid valida arstidel ajanappuse korral tõhusamaid raviviise.
Toimetaja: Jaan-Juhan Oidermaa