Suurte infohulkade analüüsimisoskus tõi eestlasele rahvusvahelise tunnustuse

Tartu ülikooli bioinformaatika teadur Konstantin Tretjakov võitis ülemaailmsel suuremahulise infohulga ehk big data analüüsivõistlusel „TEXATA“ enam kui 2000 konkurendi hulgas kolmanda koha.
Esmakordselt toimunud võistlusel pandi proovile osalejate võime analüüsida suuremahulisii infohulki. Finaali pääsemiseks pidid võistlejad läbima kaks online-kvalifikatsiooni vooru. Texaseses Austinis toimuvasse finaali pääsesid 12 parimat. Tosina parima hulka jõudis ka hetkel doktoritööd kirjutav bioinformaatika teadur Tretjakov
Esimeses voorus tuli noormehel nelja tunni jooksul vastata online-keskkonnas 50le valikuvastustega küsimusele ja lahendada kümme praktilist ülesannet kasutades Hadoop-nimelist paralleelarvutustehnoloogiat. Teises online-voorus, kuhu pääses 200 võistlejat, pidid osalejad taaskord nelja tunni jooksul vastama kümnele mõistatuse-stiilis küsimusele ning lahendama peaülesande. Ülesandeks oli antud ~60GB Thomson-Reutersi tekstiandmeid ja üldine suund lahenduseks – leida tuli, millal ostab üks firma teise.
„Oma lahenduses tõdesin, et signaali, mida otsitakse, tegelikult ei leidu, aga arvatavasti tänu mõistlikule ja praktilisele lähenemisele pääsesin ühena 12st finaalüritusele Austinisse,“ rääkis teadur.
Finaalüritusel oli võistlejatele antud ette foorumi Cisco Support diskussioonid. „Enda lahenduses realiseerisin prototüübina seotud diskussioonide otsingu ning diskussioonide sildistamine,“ selgitas Tretjakov.
Lõpuks oli igal finalistil oma lahenduse esitamiseks aega kolm minutit. Pärast seda pidid võistlejad veel 10 minutit privaatselt ühele kohtunikule tehnilisi detaile näitama. „Iga kohtunik andis enda arvamuse järgi punktid mitmes kategoorias, hinnates näiteks praktilisust, väärtust, teostuse kvaliteeti ja tehnoloogiate kasutust jne, ning selle järgi otsustati võitja,“ sõnas kolmanda koha ja „Top Student“ tiitli võitja.
Arvutiteaduse instituudi juhataja professor Jaak Vilo lisas, et suurte andmete analüüs nõuab korraga head mitmekülgset ettevalmistust algoritmide, andmekaeve, masinõppe, visualiseerimise ja rakendusvaldkondade poolt.
Toimetaja: Jaan-Juhan Oidermaa