Suurte infohulkade analüüsimisoskus tõi eestlasele rahvusvahelise tunnustuse ({{commentsTotal}})

Konstantin Tretjakov.
Konstantin Tretjakov. Autor/allikas: TEXATA

Tartu ülikooli bioinformaatika teadur Konstantin Tretjakov võitis ülemaailmsel suuremahulise infohulga ehk big data analüüsivõistlusel „TEXATA“ enam kui 2000 konkurendi hulgas kolmanda koha.

Esmakordselt toimunud võistlusel pandi proovile osalejate võime analüüsida suuremahulisii infohulki. Finaali pääsemiseks pidid võistlejad läbima kaks online-kvalifikatsiooni vooru. Texaseses Austinis toimuvasse finaali pääsesid 12 parimat. Tosina parima hulka jõudis ka hetkel doktoritööd kirjutav bioinformaatika teadur Tretjakov

Esimeses voorus tuli noormehel nelja tunni jooksul vastata online-keskkonnas 50le valikuvastustega küsimusele ja lahendada kümme praktilist ülesannet kasutades Hadoop-nimelist paralleelarvutustehnoloogiat. Teises online-voorus, kuhu pääses 200 võistlejat, pidid osalejad taaskord nelja tunni jooksul vastama kümnele mõistatuse-stiilis küsimusele ning lahendama peaülesande. Ülesandeks oli antud ~60GB Thomson-Reutersi tekstiandmeid ja üldine suund lahenduseks – leida tuli, millal ostab üks firma teise.
 
„Oma lahenduses tõdesin, et signaali, mida otsitakse, tegelikult ei leidu, aga arvatavasti tänu mõistlikule ja praktilisele lähenemisele pääsesin ühena 12st finaalüritusele Austinisse,“ rääkis teadur.
 
Finaalüritusel oli võistlejatele antud ette foorumi Cisco Support diskussioonid. „Enda lahenduses realiseerisin prototüübina seotud diskussioonide otsingu ning diskussioonide sildistamine,“ selgitas Tretjakov.
 
Lõpuks oli igal finalistil oma lahenduse esitamiseks aega kolm minutit. Pärast seda pidid võistlejad veel 10 minutit privaatselt ühele kohtunikule tehnilisi detaile näitama. „Iga kohtunik andis enda arvamuse järgi punktid mitmes kategoorias, hinnates näiteks praktilisust, väärtust, teostuse kvaliteeti ja tehnoloogiate kasutust jne, ning selle järgi otsustati võitja,“ sõnas kolmanda koha ja „Top Student“ tiitli võitja.
 
Arvutiteaduse instituudi juhataja professor Jaak Vilo lisas, et suurte andmete analüüs nõuab korraga head mitmekülgset ettevalmistust algoritmide, andmekaeve, masinõppe, visualiseerimise ja rakendusvaldkondade poolt.

Toimetaja: Jaan-Juhan Oidermaa



ERR kasutab oma veebilehtedel http küpsiseid. Kasutame küpsiseid, et meelde jätta kasutajate eelistused meie sisu lehitsemisel ning kohandada ERRi veebilehti kasutaja huvidele vastavaks. Kolmandad osapooled, nagu sotsiaalmeedia veebilehed, võivad samuti lisada küpsiseid kasutaja brauserisse, kui meie lehtedele on manustatud sisu otse sotsiaalmeediast. Kui jätkate ilma oma lehitsemise seadeid muutmata, tähendab see, et nõustute kõikide ERRi internetilehekülgede küpsiste seadetega.
Hea lugeja, näeme et kasutate vanemat brauseri versiooni või vähelevinud brauserit.

Parema ja terviklikuma kasutajakogemuse tagamiseks soovitame alla laadida uusim versioon mõnest meie toetatud brauserist: