Nobeli füüsikapreemia pälvisid tehisnärvivõrgu ristiisad
Nobeli auhinna füüsikas pälvisid sellel aastal Ameerika füüsik John Hopfield ja Briti-Kanada arvutiteadlane Geoffrey Hinton, kelle avastused panid aluse tehisnärvivõrkudel põhinevale masinõppele, millest on kasu pea kõikjal, alates astronoomiast lõpetades tekstide tõlkimise ja tehisaru treenimisega.
John Joseph Hopfield (91) on Princetoni Ülikooli molekulaarbioloogia emeriitprofessor. Geoffrey Everest Hinton (76) on Toronto Ülikooli arvutiteaduste emeriitprofessor.
Hopfieldil õnnestus oma tööga jõuda 1980. aastatel struktuurini, mis suudab mustreid talletada ja taasluua. Tartu Ülikooli masinõppe kaasprofessori Meelis Kulli sõnul on tegu tähelepanuväärse avastusega, sest see sarnaneb inimeste assotsiatiivse mäluga. Piltlikult saab tulla masina juurde isegi kohviplekkidega pildiga ja paluda see arvutimälust ülest otsida.
"See on üpris sarnane sellega, mida inimesed suudavad. Toonased arvutisüsteemid seda pigem teha ei osanud. Kõige olulisem oli aga paradigma muutus ehk kuidas sellele probleemile läheneda. Hopfield näitas ära, kuidas kasutada statistilisest füüsikast tuntud mudeleid osakeste omavaheliste vastastikmõjude kohta ja saada sellest inspiratsiooni," selgitas Kull.
Hinton leiutas aga 1990. aastatel meetodi, mis suudab iseseisvalt avastada andmete omadusi, mis on muutunud eriti oluliseks praegu kasutatavate suurte tehisnärvivõrkude juures. Sarnaselt Hopfieldile ammutas ta inspiratsiooni statistilisest füüsikast. Hintoni lähenemisviis ja tema loodud masin töötab aga veidi teisiti kui Hopfieldi võrk.
Kui Hopfieldi võrgus on tehisneuronite vahelised ühendused kahesuunalised ehk närvirakud saavad teineteist mõjutada, siis Boltzmanni masinas on need ühesuunalised. Samuti õpivad tehisnärvivõrgud erineval viisil. Hopfieldi võrgus tugevnevad ühendused juhul, kui neuronid on samal ajal aktiivsed. Boltzmanni masinas otsib võrk parimat võimalikku konfiguratsiooni juhuslike valikute abil. Plusspoolena aitab see modelleerida keerukamaid andmetes olevaid seoseid.
"Hintoni ja mõnede teiste tehisnärvivõrkude ristiisade puhul oli märkimisväärne just see, et nad tegelesid tehisnärvivõrkude teemaga edasi ka siis, kui valdav hulk teadlasi ei uskunud, et neist asja saab," sõnas kaasprofessor.
Kull lisas, et see pakub õppetundi ka tänapäeval tegutsevatele teadlastele. "Kui tunned, et sul on õige idee ja usud oma vaistu, on vaja hoolimata ümbritsevate teadlaste negatiivsest mõttelaadist oma tööd edasi teha," märkis kaasprofessor.
Kuigi arvutid ei suuda veel klassikalises mõttes inimestele sarnaselt mõelda, panid Hopfieldi ja Hintoni avastused sellega aluse ajule iseloomulikele funktsioonidele: mälule ja õppimisele.
"Huvitav on just see, et ühest küljest said need avastused ise inspiratsiooni füüsikast. Teisest küljest on need samad avastused peale edasiarendamist arvutiteaduse valdkonnas jõudnud kasutusele uuesti füüsikavaldkonnas," ütles Kull. Füüsikateadustes, näiteks astronoomias, saab andmeid tema sõnul masinõppe vahenditega analüüsida rohkem ja paremini.
Lisaks on tehisnärvivõrkudel põhinevad tehisintellekti lahendused kasutusel paljudes eluvaldkondades. "Meil on suured keelemudelid, pildi genereerimise vahendid, tekstituvastus kõnest ja väga palju muid rakendusi, kus on kasutusel masinõpe," loetles kaasprofessor.
Üksikasjad
Piltlikult võib kujutada treenimata Hopfieldi võrku liivatasandikuga, mida tabab hoovihm. Treeningu tulemusena tekib sellest orgude ja küngaste süsteem, milles on jäädvustunud iga treenimiseks ette antud muster. Sellele ebatäieliku mustri ette andmine on võrreldav süsteemi kuulikese pillamisega. Kuulike jõuab varem või hiljem kohta, kus ümbritsevad seda ainult künkad ehk selle potentsiaalne energia on nii väike kui võimalik. Sarnaselt üritab Hopfieldi võrk leida ebatäieliku mustri peale salvestatud mustri, mille energia on nii väike kui võimalik.
Täpsemalt kasutas Hopfield oma struktuuri loomiseks materjalide omadust, mis on tingitud selle moodustavate aatomite spinnist. Viimase kohaselt võib kujutada iga aatomit tillukese magnetina. Hopfieldi võrku tervikuna saab kirjeldada sarnaselt spinnisüsteemides leiduva energiaga. Selle treenimiseks tuleb leida võrgustike sõlmpunktide vahelised väärtused, kusjuures talletatud piltide energia peab olema võimalikult väike.
Hiljem rikutud või ebatäielikku pilti kohates hakkab Hopfieldi võrk süstemaatiliselt sõlmpunktide vahelisi väärtusi uuendama, et süsteemi koguenergia langeks. Seeläbi üritab leida see salvestatud pilti, mis meenutab kõige rohkem ebatäielikku pilti, mis sellele ette söödeti.
Hopfieldi 1980. aastatel loodud võrk koosnes 30 sõlmpunktist ehk nende kõigi ühendamisel sai tekkida kokku 435 ühendust. Sajast sõlmpunktist loodud võrk oli toonaste arvutite jaoks aga juba liiga keerukas. Võrdlusena võib leida tänapäevastest suurtest keelemudelitest juba triljon ehk miljon miljonit parameetrit.
Hinton kasutas Hopfieldi võrku inspiratsiooniallikana, kuid lasi käiku teistsuguse meetodi: Boltzmanni masina. See suutis õppida ära tundma ükskõik millistele andmetele iseloomulikke elemente. Masina tööpõhimõtte toetus statistilisele füüsikale, mille uuritavad süsteemid koosnevad paljudest samasugustest üksikosadest.
Masina treenimiseks söötis Hinton sellele ette näiteid andmetest, millega võiks see oma töö käigus kokku puutuda. See võimaldas liigitada näiteks pilte või luua uusi mustreid, mille elemendid sarnanesid treeningmaterjalile. Kuna tegu on juhuslikkusel põhineva protsessiga, oli esialgne Boltzmanni masin võrdlemisi ebatõhus ja lahenduseni jõudmine võttis omajagu aega.
Aastal 2006 esitles ta kolleegidega võimalust aga võrgustike eeltreenimiseks, kus laoti hulk Boltzmanni masinaid üksteise peale kihtidena. See võimaldas piltidel olevaid elemente kiiremini ära tunda. Koos varasemate avastuste ja leiutistega võimaldas see masinõppe arengut 2010. aastatel hüppeliselt kiirendada, ladudes vundamendi muu hulgas praegustele tehisarul põhinevatele rakendustele.
Möödunud aastal pälvisid Nobeli füüsikaauhinna ameeriklane Pierre Agostini, sakslane Ferenc Krausz ja prantslane Anne L'Huillier. Kolmik suutis oma eksperimentaalsete meetoditega tekitada sedavõrd lühikesi valgusvälgatusi, et nendega sai uurida isegi molekulides elektronide liikumist ja keemilisi reaktsioone.
Nobeli füüsikapreemiat antakse välja alates 1901. aastast. Alates 2023. aastast on Nobeli preemia väärtus 11 miljonit Rootsi krooni (u 952 000 eurot). Lisaks rahalisele auhinnale saavad laureaadid Nobeli bareljeefiga kuldmedali ja diplomi.
Rootsi Teaduste Akadeemia annab teisipäeval teada, kes saab sellel aastal Nobeli auhinna füüsika alal. Ülekannet pressikonverentsilt saab jälgida ka Novaatori vahendusel.
Toimetaja: Jaan-Juhan Oidermaa