DeepMindi tehisintellekt edestas go-meistrit ka viimases mängus
Viimase kümnendi üks parimaid go-mängijaid Lee Se-dol pidi ettevõtte DeepMind loodud tehisintellekti AlphaGo paremust tunnistama ka viimases mängus. Viiest kohtumisest õnnestus arvutite jaoks veel vähemalt järgmisel paaril aastal ületamatult raskeks peetud mängus meistril võita korra.
Viimase mängu järel korraldatud pressikonverentsil märkis Lee siiski, et ei pea AlphaGo-d ilmtingimata inimmängijatest paremaks. Küll aga panid masina poolt tehtud käidud teda mängu olemuse üle sügavalt järele mõtlema ja tema enda mõningates ideedes kahtlema. Samuti kahetses ta nädala kestnud kohtumiste seeria lõppemist.
DeepMindi asutaja ja AlphaGo üks loojatest Demis Hassabis leidis, et viimane kohtumine oli tema töörühma jaoks kõige põnev stressirikkam.
19x19 joonega ruudulisel mängulaual mängitava go raskus avaldub arvutite jaoks esmajoones potentsiaalsete võimalike käikude arvus. Eerinevate go-laual nähtavate kombinatsiooni arv ulatub 10E171'ni, mida on suurusjärkude võrra rohkem kui universumis aatomeid. Iga käigu tegemisel on mängijatel selleks tüüpiliselt 200 erinevat võimalust. Pelga arvutusvõimsuse pealt seega elukutselisi go-mängijaid ei võida. Enne 2015. aastat suutsid parimad programmid edestada tavasuuruses go-laual täiendavate eelisteta vaid kogenud amatööre.
Sellest lähtuvalt ennustasid mitmed visionäärid nagu DeepMind'i investeerinud SpaceX'i tegevjuht Elon Musk, et masin suudab go-meistreid järjepidevalt võita alles kümne aasta pärast. Valdkonnaga lähemalt kursis olevad masinõppele keskenduvad teadlased nagu Michael Bowling pidasid realistlikumaks paari aastat. Sellele vaatamata suutis AlphaGo lüüa möödunud aastal Euroopa meistrit ja maailma edetabelis 633. kohal olevat Fan Huid tulemusega 5–0.
Viimase 20 aasta jooksul 18 maailmameistrit tiitlit võitnud Lee osutus programmile aga oma loovama ja ebahariliku mängustiiliga suuremaks väljakutseks. Kuigi kohtumiste seeria võitja selgus AlphaGo kolme järjestikuse võidu tõttu juba kolmandaks mänguks, suutis Lee arvuti neljandas mängus üllatuslikult seljatada. Enne viimast mängu hindas ta Hiina rahvatelevisioonile antud intervjuus oma võidu tõenäosuseks 60 protsenti ehk meister oli siiski ilmselgelt pessimistlikum kui enne oma esimest mängu.
Kuigi AlphaGo tegi viienda mängu käigus kommentaatorite hinnangul amatöörliku vea, suutis programm kaotatud edumaa tagasi võita ning Lee pidi 280 käiguks masinale alla vanduma. Enam kui viis tundi kestnud mängu tasavägisusest annab tunnistust asjaolu, et see kestis eelnevatest pea 100 käiku kauem. Sellegipoolest valgusid Lee silmadesse pärast tulemuse väljakuulutamist pisarad.
AlphaGo 4–1 võit ei tähenda vaid, et arvuti suudab inimesi eelisteta või petmata edestada veel ühes lauamängus, vaid iseloomustab ka tänaseks välja töötatud algoritme võimekust. Go-mängu võitmiseks tarvilikke oskusi läheb tarvis ka näiteks fotodel nägude ja esemete ning hääle vahendusel antavate käskude tuvastamiseks.
Enne go-mängus vilumuse saavutamist oli AlphaGo aluseks olnud tehisintellekt kogunud maailmas tuntust oma õppimisvõimega. Muu hulgas suutsid DeepMind'i insenerid panna selle süvaõppe ja tehisnärvivõrkude kombineerimisega õpetama endale 49 arcade-tüüpi mängu. Möödunud aasta veebruariks suutis tehisintellekt saada neist inimestest parema tulemuse 26s.
Toimetaja: Jaan-Juhan Oidermaa