Liiginimede kõrval hakkavad paralleelselt kehtima DOI-koodid

Linnaea borealis ehk harakkuljus oli Carl von Linne lemmiktaim ja on seetõttu ka tema järgi nimetatud.
Linnaea borealis ehk harakkuljus oli Carl von Linne lemmiktaim ja on seetõttu ka tema järgi nimetatud. Autor/allikas: CC/Flickr

Tartu Ülikooli teadlased lõid eluslooduse liiginimede kirjeldamiseks uue mehhanismi. Enam kui 200 aastat kestnud Carl von Linné poolt algatatud klassifikatsioon ei arvesta tänapäevaste teadusmeetoditega.

Tartu Ülikooli loodusmuuseumi ja botaanikaaia all tegutsevad seeneteadlased ja taksonoomid on seni tuntud kui eElurikkuse portaali ja PlutoF platvormi loojatena, kuid nüüd võib öelda ka, et 10 aasta töö tulemusena pandi alus uuele ülemaailmsele liikide klassifitseerimist hõlbustavale süsteemile.

Alustame algusest: uut liiki avastades ja seda kirjeldades pannakse liigile ladinakeelne teaduslik nimi (nt hiljuti Tartu teadlaste poolt avastatud uus käguvaablane Brachyzapus greengoblin), liik hakkab kuuluma mingisse konkreetsesse perekonda ja sugukonda jne. Tihtipeale selgub hiljem, et algne klassifikatsioon ei osutunud õigeks ja liigi nime on vaja muuta – segadust kui palju.

Lisaks on uute kaasaegsete töömeetoditega hakatud keskkonnast liike otsima ka ilma neid kinni püüdmata. Näiteks leidub ühe järve veeproovis kõikide seal elavate kalade DNA (nii väljaheidete, kalalima kui muude eritiste kaudu) – nii on teadlaste jaoks üha levinuimaks tööviisiks keskkonnas elavate liikide kirjeldamisel vaid keskkonna proovi DNA analüüs.  

Nii töötavad ka näiteks taimejuurtega sümbioosis olevate seente uurijad. Mullas leiduvate mikromõõtmetes seente hulk on tohutu ja neid kõiki leiab vaid sealtsamast mullaproovist laboris DNA-d eraldades. DNA on aga oma olemuselt vaid kood, nukleotiidide järjestus, mida teades ei ole selle teadmisega suurt midagi peale hakata – sest kõiki maailma liikide DNA järjestusi pole liiginimedega kokku viidud ja puudub selline andmebaas, kuhu DNA järjestust sisestades liigi nime teada saaks. 

Sellise andmebaasi, esialgu seente jaoks, Tartu Ülikooli mükoloogia professor Urmas Kõljala töögrupp välja mõtleski. "Me lõime kommunikatsiooni süsteemi, et neid DNA põhjal leitud liike saaks kommunikeerida, ilma et meil taksoni (nt liigi, perekonna jne – toim) nimed oled teada," selgitab Kõljalg. "Paljusid liike teatakse vaid DNA põhjal: näiteks mikroseente analüüsimine mullas. Suur osa neist on ka teadusele kirjeldamata. Osad on kirjeldatud 50 kuni 100 aastat tagasi, aga nähtava osa põhjal ja seda ei saa siduda proovist kogutud DNA-ga."

Selleks, et DNA proovi konkreetse liigiga siduda, on vaja sellele proovile mingit unikaalset nime või koodi; sest DNA järjestus ise on liiga kohmakas – pikk, muutuv. Selleks koodiks valiti teaduskirjandusest tuntud DOI-kood (Digital Object Identifier). Igal kunagi avaldatud teadustööl on oma oma unikaalne ajas püsiv DOI-kood, mille abil saab teaduskirjanduse andmebaasidest üle maailma alati just selle ühe ja õige teadustöö üles leida. DOI-koode jagab rahvusvaheline sertifitseerimiskeskus ja DOI-koodide välja andmise õiguse (seekord siis artiklite asemel loomaliikidele või täpsemalt nende DNA proovidele) sai ka loodusmuuseum.

"Selleks on meil eraldi andmebaas UNITE, see on globaalne, seal töötab sadu inimesi, me juhime ja alustasime seda. Üle maailma on kokku kogutud teatud geenijärjestused ja nende baasil on arvutatud välja liigid, DNA põhised liigid, ja siis me oleme sinna otsa ehitanud kommunikatsioonisüsteemi, mis on alternatiivne Linné süsteemile ja see põhineb DOI-del, sama mis on ajakirja artiklitel. Igal liigil on oma DOI-kood, mis on ajas stabiilne identifikaator."

Põhimõtteliselt said teadlased hakkama sellise tööriistaga, mille abil saab uurija vaid DNA proovide põhjal teada, kes uuritavas keskkonnas elavad.

"Just," selgitab Kõljalg. "Ja see töötab praegu kõigi maailma seente kohta. Tasapisi alustame ka teiste rühmadega, nt täna tuli just kiri rühmalt, kes tahab teha seda mullaloomade kohta. Tahaks teha aga süsteemi kõikidele elusorganismidele. Kui meil seentele on see süsteem juba tehtud ja see töötab, siis on tegelikult lihtne üle minna ka teistele."

Huvitav lugu on ka DOI-koodide välja andmise õiguse saamisega – see juhtus alles 2013-2014 aastatel:

"Enne DOI-sid lõime me ise unikaalsed ja stabiilsed identifikaatorid. Aga rahvusvaheline tunnustatud süsteem on parem. Ja kui meil tekkis siis õigus välja anda lõpmatu arv DOI-sid, siis esimest korda kui me seda tegime, siis oli neid pool miljonit. Ja siis see läks sinna peakorterisse Saksamaal, kus registreeritakse neid DOI-sid, siis seal oli tükk aega vaikus. Need on teadusandmetele mõeldud DOI-d ja tol hetkel oli maailmas teadusandmetele välja antud vaid mõned tuhanded koodid. Ja meie tulime poole miljoniga kohe sisse. Ja siis nad uurisid tükk aega ja siis ütlesid, et "oi, see on kaval mõte jah" (Urmas naerab).

Liikidele (ja kui täpne olla, siis liigihüpoteesidele) antavad DOI-koodid võimaldavad eluslooduse klassifikatsiooniga töötavate teadlastel siseneda kaasaegsesse andmemaailma. Liiginimedega töötavad süstemaatikud püsivalt ja tihtipeale muutub ühe liigi määratlus paar korda aastas. Nüüd tähistab iga DOI kood ühte antud ajahetkel tehtud määrangut ja kõik vanad ja uued määrangud on andmebaasides omavahel seotud.

"Näiteks kui täna teeb keegi mullaelustiku uuringu ja saab teada, kes (kelle DNA) kuskil mullas leidub, ja siis 10 aastat hiljem keegi teeb sama uuringu ja tahab võrrelda kahe uuringu tulemusi, siis on see võimalik, sest isegi kui liigid on vahepeal ümber paigutatud, siis digiühendused on uute ja vanade liikide vahel säilinud. Tänu digilahendustele on see võimalik," on Urmas Kõljalg ootusärev uue süsteemi kasutamise osas.

Toimetaja: Randel Kreitsberg, Tartu Ülikool

Hea lugeja, näeme et kasutate vanemat brauseri versiooni või vähelevinud brauserit.

Parema ja terviklikuma kasutajakogemuse tagamiseks soovitame alla laadida uusim versioon mõnest meie toetatud brauserist: