Eestlaste geenihaiguste uurimine muutus paremaks. Kuidas nad seda tegid?
Tartu ülikooli Eesti geenivaramu doktorandid Mario Mitt ja Mart Kals, bioinformaatika ja genoomika teadur Priit Palta ning bioinformaatika vanemteadur Reedik Mägi on ambitsioonikad noorteadlased, kes viivad edasi varamu visiooni: teha igale geenidoonorile geenikaart, mis näitab, millised haigused võivad neid ohustada või millised ravimid neile ei sobi.
Miti, Kalsi, Mägi, Palta ja nende kaastöötajate teadustöö aitab senisest täpsemalt ja usaldusväärsemalt leida eestlaste geneetiliste haiguste põhjuseid. Arvutuslike vahenditega rajavad nad visalt teed tähtsatele geeniavastustele.
“Oleme nagu teatejooksu esimene vahetus: tegime ära töö, ilma milleta järgmised teadusavastused on raskendatud või sootuks võimatud,” nendivad äsja teadusajakirjas European Journal of Human Genetics avaldatud artikli esimesed autorid Mario Mitt ja Mart Kals.
Mehed ise arvavad, et avalikkust see ei huvita, sest nad ei saa osutada ühelegi haigusseoselisele geenile ja öelda: vot, näete, see geen siin põhjustab seda haigust. Ometi on nende töö tähtsamgi veel.
Geeniinformaatikutena panid nad kokku andmekogu, mis aitab senisest täpsemalt ja usaldusväärsemalt üles leida geenivariante, mis loovad eestlastel eelsoodumusi erinevate haiguste väljakujunemiseks. Ja kuna eestlased on geneetiliselt suhteliselt sarnased teistele Euroopa rahvastele, pakuvad selle töö käigus tehtud avastused, andmed ja leiud huvi ka teiste riikide teadlastele.
Rõõmusõnum ka geenidoonoritele
Unikaalne andmestik sisaldab 2244 Tartu ülikooli Eesti geenivaramu geenidoonori täielikult järjestatud ehk sekveneeritud genoomi – kokku üle 16 miljoni geneetilise variandi, millest koguni kolm miljonit on siiani leitud ainult eestlastel.
“See on justkui eestlaste geeniandmete taristu,” tutvustavad doktorandid Mitt ja Kals unikaalset andmekogu – eestlaste populatsioonispetsiifilist kogu genoomi referentspaneeli.
Lohiseva nimega andmestik on tähtis ja väga vajalik tööriist geneetikutele. Esmajärjekorras aitab see täielikult ära määrata iga geeniproovi andnud eestlase geneetilise info ehk nende genoomi täielikku järjestuse.
Genoomi järjestuse täielik määramine aitab tuvastada neid geenivariante, mis võivad põhjustada geenihaigusi.
“Panime kokku eestlaste geeniandmete referentspaneeli ja testisime selle headust. Näitasime, et sellised populatsiooniomased andmestikud võimaldavad oluliselt täpsemalt ja usaldusväärsemalt leida haigusi põhjustavaid geenivariante kui seni kasutusel olnud sarnased rahvusvahelised andmekogud. Sellesama kohalike geenidoonorite geeniandmete põhjal loodud referentspaneeliga leiame edasiste analüüside käigus eestlaste haigusseoselised geenivariandid paremini üles,” täpsustab koos Reedik Mägiga tehtud töö läbiviimist juhtinud Priit Palta.
Lisaks geeniandmeid analüüsivatele teadlastele on see rõõmusõnum just neile viiele protsendile eestlastele, kes ootavad pikisilmi sügist, mil Tartu ülikooli Eesti geenivaramu on lubanud hakata andma tagasisidet selleks soovi avaldanud geenidoonoritele nende geeniandmete kohta.
“Geenivaramu jaoks on see väga suur asi. Nüüd saame terve geenivaramu kohordi kohta põhimõtteliselt täielikud geeniandmed,” lisab teadur Palta.
Kuluka töö magusad viljad
"Põhimõtteliselt täielikud" sellepärast, et kogu genoomi ulatuses määrati geenijärjestused kalli sekvneerimisega 2244 Eesti geenidoonoril, kelle põhjal loodi populatsioonispetsiifiline kogu genoomi referentspaneel ja selle abil pannakse kokku ülejäänud, ligi 50 000 doonori genoomijärjestused.
Selline matemaatiline geeniinfo kokkupanemine sarnaneb statistilisele ennustamisele kuid nimetatakse imputeerimiseks. See täpne ja usaldusväärne meetod on geeniteadlasi üle maailma teeninud juba aastaid. Imputatsiooni täpsus ja usaldusväärsus tõuseb veelgi, kui indiviidi genoomi järjestus imputeeritakse just temale omase populatsioonispetsiifilise referentspaneeliga.
Nende teadusartikkel näitab, et populatsioonispetsiifiline andmestik annab seni laialt kasutatud rahvusvahelistest kogudest – näiteks ülemaailme 1000 genoomi projekt ja eurooplaste haplotüübi konsortsium (HRC) – parema tulemuse. Parem tulemus tähendab siinkohal kõrgemat usaldusväärsust ja väiksemat vigade aru imputatsiooni abil kokkupandud geeniandmetes.
Loogika selle taga on lihtne: ennast tasub võrrelda ikka endasugustega.
Tartu ülikooli Eesti geenivaramu teadlased on esimesed, kes näitasid, et kui seni peeti geenivariantide imputeerimisel kõrge täpsuse saavutamiseks kõige olulisemaks referentsandmestikus olevate täisgenoomide hulka, siis vähemalt eurooplaste puhul on tegelikult palju olulisem hoopis imputeeritava indiviidi genoomi sarnasus referentsandmesikule.
“Nüüd on meil selle projekti esimene osa tehtud ja eestlaste referentsandmestik olemas,” võtab Priit Palta kokku umbes aastapikkuse töö. “Järgmiseks alustame assotsiatsioonianalüüsidega, et leida üles haigusseoselised geenivariandid.”
Saadud tulemuste põhjal julgeb Palta populatsioonispetsiifilise genoomi referentspaneeli loomist soovitada ka teistele. Lisaks geeniinformaatikute tööle läheb selleks muidugi tarvis biopanka või muud geenidoonorite andmekogu, ning ära tuleb teha ka kallis sekveneerimine ehk täielike genoomijärjestuste määramine.
Euroopas on sellega hakkama saanud veel Island, Soome, Rootsi, Holland, Suurbritannia ja sitsiillased.
Mis on geeniandmete imputeerimine?
Lühike meeldetuletus: inimese genoom on jagatud kromosoomideks, kromosoomid sisaldavad geene ja geenid on tehtud DNA-st – ainest, mis säilitab pärilikku infot; kokku on inimese genoomis rohkem kui 3 miljardit nukleotiidi ehk ehituskivi.
Ühe genoomi täieliku järjestuse määramine sekveneermise abil maksab umbes paar tuhat eurot. Mitu suurusjärku odavamalt, vähem kui 100 euroga, saab geenivariante määrata mikrokiibiga. Kuid kiibiga saadakse kätte vaid osaline geeniinfo – täpselt see osa, mida parasjagu küsitakse, kõige muu suhtes on meetod pime.
Neid kahte lähenemist kombineerides ja võttes appi matemaatika, saab mikrokiibiga analüüsitud indiviidide genoomide täielikud järjestused väga täpselt ja usaldusväärselt ka ennustada ning kokku panna. Säärast genoomijärjestuse statistilist ennustamist nimetavad teadlased imputeerimiseks ning selle eelduseks on genoomi referentspaneeli olemasolu.
Piltlikult väljendades on tegemist justkui erilise rahvastiku peegliga, kuhu vaadates on võimalik näha ühe indiviidi mikrokiibiga nähtamatuks jäävaid geenivariante. Metafoorid kõrvale jättes on jutt siiski tohutust andmekogust – digitaalsetest nullidest ja ühtedest.
Teadusartikli kaasautoriks on Geenivaramu geeniteadlaste Andres Metspalu, Tõnu Esko ja Andrew Morrise kõrval ka omaaegne Barack Obama teadusnõunik ning maailma bioloogiateaduse tippkeskuse Broad instituudi asutaja Eric Lander. Eric Lander on tunnustanud eestlasi geeniandmete kogumist ka ERR Novaatori vahendusel.
Projekti rahastati Personaalse meditsiini pilootprojekti "Eestlaste genoomivarieeruvuse andmebaasi loomine" – PerMed I ja põhjamaade koostööprogrammi NIASC ("The Nordic Information for Action eScience Center") raames.