Uus tehisarumudel õppis lugema inimgenoomi salajast grammatikat

Google'i Deepmindi teadlased esitlesid tehisarumudelit AlphaGenome, mis suudab analüüsida korraga miljonit DNA-tähte ja ennustada selle põhjal 11 erinevat bioloogilist protsessi, näiteks kuidas DNA-d rakus kokku pakitakse. Uus tööriist aitab mõista, kuidas isegi geenidest kaugel asuvad mutatsioonid mõjutavad rakkude tööd ja haiguste teket.
Inimese genoom on justkui hiiglaslik instruktsioonide kogumik, millest moodustavad valkude valmistamise eest vastutavad geenid vaid kaks protsenti. Ülejäänud 98 protsenti on täidetud grammatikaga võrreldava regulatoorse infoga. See määrab, millal ja kui palju geene sisse või välja lülitatakse. Teadlastel on olnud seni keeruline seda varjatud koodi täielikult mõista, sest olulised juhised võivad asuda geenist endast väga kaugel.
Ajakirjas Nature avaldatud uuringus kirjeldab nüüd töörühma AlphaGenome, mis suudab anda korraga DNA-ga seotud protsessidele ühe megabaasi ehk miljoni tähe pikkuse konteksti. See võimaldab mudelil näha seoseid, mis jääks kitsama vaateväljaga tööriistadele märkamatuks.
Uus mudel ei piirdu korraga vaid ühe ülesande lahendamisega, vaid ennustab samaaegselt tuhandeid erinevaid genoomseid signaale. Teadlaste sõnul suudab see prognoosida 11 erinevat bioloogilist modaalsust. Lihtsamas keeles ei vaata mudel genoomi vaid ühest vaatenurgast, vaid analüüsib 11 erinevat infokihti, alates sellest, kas DNA on füüsiliselt lahti pakitud ja loetav, kuni selleni, millised keemilised märgised või valgud on sinna parajasti kinnitunud.
See on oluline edasiminek, sest varasemate mudelite puhul tuli sageli valida, kas vaadata pikka DNA lõiku madalama täpsusega või lühikest lõiku suure täpsusega. AlphaGenome ühendab need kaks lähenemist, pakkudes kõrget lahutusvõimet pika vahemaa taha.
Erilist tähelepanu pöörab mudel splaissimisele. Selle protsessi käigus lõigatakse geenist välja mittevajalikud osad ja kleebitakse kokku lõplik juhis valgu tootmiseks. AlphaGenome suudab ennustada nii lõikuspunkte kui ka seda, kui sageli erinevaid ühendusi kasutatakse. See aitab mõista, kuidas üheainsa tähe muutmine DNA-s võib rikkuda kogu valgu tootmise ahela, mis võib päädida haigusega.
Laborikatsed arvutis
DeepMindi teadlased panid mudeli proovile leukeemiat ehk verevähki uurides (T-ALL), täpsemalt võtsid nad luubi alla TAL1-nimelist geeni. Tervel inimesel aitab see geen immuunrakkudel küpseda, et need suudaksid haigustekitajatega võidelda. Kui rakud on välja arenenud, lülitub geen välja.
Teadlased on aga avastanud, et mutatsioonid, mis asuvad TAL1-st endast 8000 DNA-tähe kaugusel, võivad selle lüliti püsivalt tööle jätta. See viga sunnib immuunrakke kontrollimatult paljunema, põhjustadeski vähki. Mudel ennustas õigesti nii muutusi geenide avaldumises kui ka seda ümbritsevates histooni-märgistes.
Võrreldes teiste tipptasemel mudelitega jõudis AlphaGenome samale tasemele või ületas neid 25-s 26-st uuritud kategooriast, mis mõõtsid geenivariantide mõju ennustamise täpsust. See tähendab, et teadlased saavad nüüd teha usaldusväärsemaid arvutipõhiseid eksperimente.
Samas ei kaota AlphaGenome vajadust päris laborikatsete järele, vaid see toimib pigem digitaalse eelvalikuna. Mudel aitab teadlastel miljonite võimalike mutatsioonide seast välja sõeluda need kõige kriitilisemad, mille paikapidavust tuleb seejärel tavapärases n-ö märjas laboris füüsiliselt kinnitada.
Lisaks tunnistavad ka autorid ise, et mudelil on omad piiranguid. Kuigi see suudab hästi ennustada geenide avaldumist, on koe-spetsiifilisi erinevusi endiselt keeruline täpselt tabada. Samuti treenis ettevõtte mudelit peamiselt inimese ja hiire andmetel ehk teiste liikide puhul ei pruugi sellest erilist kasu tõusta.
Vaatamata neile kitsaskohtadele pakub uus tööriist teadlastele nende sõnul tõhusat vahendi, et lugeda ja tõlgendada pärilikkusaine seni varju jäänud grammatikat.
Toimetaja: Jaan-Juhan Oidermaa


























