Tehisintellekt leidis pea kõigi tuntud valkude kuju
Google'i all tegutseva ettevõtte DeepMind loodud tehisintellekt ennustas, kuidas näevad välja umbes 200 miljonit teadusele tuntud valku. Saavutus tõotab hüppeliselt kiirendada nii uute ravimite leidmist kui ka aitab mõista paremini elusorganismis toimuvat.
Valgud on elusorganismi peamised tööhobused. Sõltuvalt valgust aitavad võidelda need muu hulgas haigustekitajate vastu, liigutavad kehas erinevaid molekule, kiirendavad keemilisi reaktsioone ja toestavad rakke. Otstarbe määramisel ei ole seejuures oluline vaid see, millistest aminohapetest see ise koosneb. Tähtis ka selle kolmemõõtmeline kuju.
Ajalooliselt on olnud selle määramine töömahukas ülesanne. Näiteks on nõudnud see valkude kristalliseerimist, et seda üleüldse röntgenkiirtega aatomite tasemel uurida saaks. Valkude hapruse tõttu oli see sedavõrd keerukas, et ainuüksi ühe valgu kuju ja ülesande välja selgitamist peeti doktorikraadi vääriliseks väljakutseks. Looduses käib see tänu füüsikale lihtsamalt ja iseeneslikult. Valgu valmistamise järel voldib see end vajalikku vormi loetud millisekunditega.
Põhimõtteliselt saab ennustada valkude kolmemõõtmelist kuju ka arvutuslikult. Kuna isegi pelgalt 2000 aminohappest koosneb valk saab voltida end 10300 erineval viisil, jäi aga puhtalt toorele jõule toetudes selleks tarvilikust arvutusvõimsusest aastakümneid vajaka. Enne tehisintellekti vallas toimunud revolutsiooni olid suutnud bioloogid 40 aasta jooksul välja selgitada ainult ligikaudu 190 000 valgu kuju.
DeepMind'i teadlased kasutasid probleemi lahendamiseks sarnast lähenemist kui varasematel aastatel inimestest male- ja go-meistrite seljatamiseks. Algoritm AlphaFold õppis sarnaselt inimestele olemasolevate näidete varal seaduspärasid, mis valkude kuju määravad. Erinevalt inimestest suudavad masinad hoomata aga üheaegselt suuremaid andmehulki ja kontrollida oma ennustuste paikapidavust paljude lühema aja jooksul. See aitab õpikõverat märkimisväärselt lühendada.
Nõnda teatas ettevõte juba aasta eest, et loonud ligi 350 000 valgu kuju sisaldava kataloogi. Andmebaas haaras toona peaaegu kõiki inimese ja veel 19 põhjalikult uuritud imetajaliigi valmistatavaid valke. Nüüd esitletud kataloog UNIPROT sisaldab aga umbes miljoni liigi valmistatavat 214 miljonit valku ehk peaaegu kõiki teadusele praeguseks tuntud proteiine.
Euroopa Bioinformaatika instituudi hinnangul on 35 protsendi ennustuste täpsus võrreldav katseliselt saadavate tulemustega. Veel umbes 45 protsenti ennustustest on piisavalt täpsed, et neist oleks kasu mitmetes praktilistes rakendustes. Kehvemapoolsed ennustused on samas enamasti hõlpsasti märgatavad. Alati pole ennustuse ebatäpsuses süüdi ka algoritm ise. Mõnikord vajab valk oma kuju säilitamiseks mõnda teist molekuli.
Kataloog tõotab muu hulgas hõlbustada uute ravimite leidmist. Tihti algab võimaliku ravimi toimeaine tõhususe hindamine just selle struktuuri uurimisest.
Ühtlasi võib olla sellest kasu erinevate haiguste tekkepõhjuste mõistmisel. Mõnel juhul võib olla haiguse taga vaid üks geenimutatsioon, mille mõjul voldib end selle alusel valmistatav valk end veidi valesti. Kui Alzheimeri tõbi on tuntud näide, siis teistel juhtudel on tegu sedavõrd haruldase haigusega, et selle uurimiseks on eraldatud vahendeid vähe või üldse mitte.
Ühtlasi loodavad teadlased, et sedavõrd mahukas kataloog aitab mõista valkude enda evolutsiooni. Seni on olnud valguinfot koondavad andmebaasid olnud kaldu inimeste suunas.
Loodud andmebaas ja valkude kuju ennustamiseks kasutatud algoritm on vahalt kättesaadav kõigile teadlastele. DeepMind'i teatel on kasutanud praeguseks üle 500 000 teadlase, kes on vaadanud enam kui kahe miljoni valgu kuju.
Toimetaja: Jaan-Juhan Oidermaa