Doktoritöö: kuidas muuta vähiravimite väljatöötamine tõhusamaks?
Järjest suurenevad andmemahud meditsiinis ja geneetikas teevad bioinformaatikast üha nõutuma eriala. Täna kaitseb Tartu ülikoolis doktoritööd arvutiteaduse instituudi bioinformaatik Tauno Metsalu, kes kasutab mitmemõõtmeliste andmete statistilise analüüsi muu hulgas selleks, et täiustada vähimudeleid. Kuidas ta seda teeb?
Vähk on keeruline haigus, mida inimkond pole siiani suutnud kontrolli alla saada. Et säästa vähipatsiente, toimuvad teadusuuringud uute ravimite leidmiseks esmalt laboris selleks loodud vähimudelitel.
Mudelitega on loodud tehislikud tingimused, mis käituksid võimalikult sarnaselt inimese vähiga. Ükski mudel pole täiuslik, alati on see võrreldes inimese vähiga millegi poolest veidi erinev. Seetõttu on tekkinud ravimite väljatöötamisel suur probleem: enamik uutest ravimikandidaatidest, mis tunduvad mudelil hästi töötavat, ei toimi siiski hilisematel inimkatsetel. Et mudelid imiteeriksid paremini inimese vähki, on neid vaja täiustada.
Vähimudelite tüübid
Keerukuse poolest on mudelid väga erinevad. Lihtsamad mudelid põhinevad erilist tüüpi rakkudel ehk rakuliinil. Kunagi elusobjektilt saadud rakud on tehtud nii-öelda surematuks, et neid oleks laboritingimustes mugav kasutada.
Keerulisemad ja inimesega rohkem sarnased mudelid on laborihiired. Neile on tekitatud vähk kas geenide muundamise või vähikoe siirdamisega. Loomade kasutamisel teadustöös on aga ranged piirangud, võimalusel tuleb nende kannatusi ja arvu vähendada või üldse asendada mitteliikuva bioloogilise materjaliga. Seepärast on loodud keskmise keerukusega mudelid, kus hiirest võetud kasvaja on lõigatud õhukesteks lõikudeks, et teda saaks mitmes katses kasutada ja seega oluliselt katsehiirte arvu vähendada.
Mudelite võrdlemine
Mudeleid on võimalik üksteisega võrrelda, uurides valkude käitumist. Valgud on elusorganismi peamised tööriistad, mis juhivad kõiki elutähtsaid protsesse.
Tänapäevaste vahenditega on võimalik koguda palju andmeid, mõõtes erinevate valkude kogust paljudel mudelitel. Selliseid korrapäraselt kogutud andmeid saab näidata tabeli kujul, et võrrelda valkude koguse mustreid. Tabelit vaadates on aga raske esmapilgul aru saada, millised mudelid on inimese vähiga sarnasemad või milline valk põhjustab mudelite vahel kõige suurema erinevuse. Seepärast on kasulik lisada tabelile värviskaala, mille abil tekib tabelist niinimetatud soojuskaart. Nagu nimetus ütleb, võib sel viisil valkude kogust näidata nagu õhutemperatuuri geograafilisel kaardil – väiksemaid koguseid külmade toonidega ja suuremaid koguseid soojematega. Sellisel juhul on kohe näha, milliste valkude kogus on mõne mudeli korral äärmuslik.
Võib juhtuda, et tabelis on sarnased mudelid või valgud üksteisest eemal. Siis on kasulik ridu või veerge ümber järjestada, et tekiksid sarnase mustriga piirkonnad. Et selliselt tekkivaid gruppe lihtsamini tõlgendada, võib joonisele lisada ka eelnevalt teada olevad rühmitused.
Näiteks võib kõik rakuliinid tähistada sama värvikoodiga ja valke eristada vastavalt nende ülesandele. Kui ridu või veerge on väga palju, võib ka sarnaselt käituvate valkude või mudelite grupid kokku võtta ja tähistada nende keskmise mustriga, et joonis oleks selgem.
Soojuskaart ei võimalda aga anda väga täpset ülevaadet, kui kaugel ikkagi on mudelid üksteisest. Üks võimalus seda teha oleks võtta kaks valku ja teha mudelitest punktidega joonis, kus nende kahe valgu kogus on võetud koordinaatideks. Mudelid oleks siis nagu linnad geograafilisel kaardil ja nende vahelisi kaugusi oleks silmaga mugav hinnata. Probleem tekib aga sellest, et valke on enamasti tunduvalt rohkem ja on päris raske leida, millised kaks valku annavad meile kõige huvitavama joonise. Muidugi võiksime neid järjest läbi proovida, aga see võtaks tohutult aega.
Lahenduse leidmiseks oletame hetkeks, et oleme mõõtnud kolme valku. Nagu linnade korral, võime nüüdki valkude kogusest mõelda kui koordinaatidest. Seekord on aga koordinaate kolm ja tasapinnalise kaardi asemel kujutame ette, et mudelid on nagu hõljuvad tennisepallid toas. Igaühe asukoht põranda suhtes ning kõrgus olgu määratud nende kolme valgu kogusega.
Tahame saada sellest tennisepallide pilvest kõige huvitavamat ülevaadet. Teiste sõnadega, kust poolt peaksime tennisepalle vaatama, et need tunduksid võimalikult laiali ja annaksid meile seega võimalikult palju teavet nende hajuvuse kohta? Samal ajal jääb siis ka võimalikult vähe hajuvusest sellest suunast vaadates nägemata.Käepärastest vahenditest tehtud mudelit, mis näitlikustab peakomponentide analüüsi põhimõtet.
Matemaatikud on selle probleemi lahendanud peakomponentide analüüsi abil. Veel enam, kolmemõõtmelist ruumi on matemaatiliselt võimalik üldistada ja teha sama analüüsi kui tahes paljude valkudega. Niisiis võime ükskõik kui suurte mõõtmetega tabelist teha tasapinnalise joonise, mis näitaks andmeid kõige huvitavamast suunast.
Eelnevalt kirjeldasin vaid mõnda näidet suuremahuliste bioloogiliste andmete analüüsist, millega tegeleb bioinformaatika. See on suhteliselt uus teadusharu, mis uurib, kuidas rakendada matemaatilisi, täpsemalt statistilisi, meetodeid pärilikkuse uurimisel, kasutades selleks suuri arvutusvõimsusi.
Erinevaid andmetüüpe ja meetodeid on palju ning andmete hulk on kasvanud plahvatuslikult. Bioinformaatika on jõudmas ka meie igapäevaellu. Ei ole enam kaugel aeg, kus meditsiin muutub personaalseks ja perearstid hakkavad otsuseid tegema iga inimese geneetiliste andmete põhjal.
Soojuskaart ja peakomponentide analüüsi joonis väljamõeldud andmetel. (Illustatsioon: Tauno Metsalu)
Tauno Metsalu doktoritööd „Mitmemõõtmeliste andmete statistiline analüüs bioinformaatikas" juhendas professor Jaak Vilo Tartu ülikooli arvutiteaduse instituudist. Oponent oli dr Simon Anders Soome molekulaarmeditsiini instituudist.
Toimetaja: Katre Tatrik, Tartu ülikool