Masinõpe aitab kaitsta inimesi ravimite kõrvaltoimete eest
Ravimitel, mida inimesed haiguste raviks võtavad, on toime kõrval ikka ka kõrvaltoimeid, tihtilugu üsnagi tõsiseid.
Eesti teadlaste tööst ja tehisaru-katsetustest võib olla abi, et mõnele konkreetsele kõrvaltoimele altid inimesed teaksid asjakohast ravimit juba eos vältida.
Uuringud näitavad, et haiglasse võetud patsientidest on kuuel kuni 15 protsendil põhjuseks ravimi kõrvaltoime, ülejäänutest 15 protsenti saab kõrvaltoimet tunda haiglas ja 2,5 protsenti ehk üks 400-st neist kõrvaltoimeta haiglasse võetuist sureb haiglas saadud ravimi kõrvaltoime tagajärjel.
Asi on päris tõsine ja sellega tegelevad teiste seas ka geeniteadlased, kes püüavad ravimite kõrvaltoimete altisuse märke leida inimeste genoomist. Seejuures võivad vajalikud andmed suurtes andmebaasides juba kirjaski olla, aga mitte alati ei ole neid sealt niisama lihtne üles leida.
Siin tulevadki mängu Tartu Ülikooli genoomika instituudi keeletöötleja ja andmekaevur Dage Särg koos kolleegidega, nende seas Kairit Sirts, Lili Milani, Jaak Vilo ja teised.
Eesti geenivaramu enam kui 200 tuhande geenidoonori kohta hoitakse varamus ka terviseandmete digikaarti, kuhu arst võib olla ravimite ja kõrvaltoimete kohta märkmeid teinud, kuid seda mitte kindlas vormis, vaid vaba eestikeelse tekstina.
Niisuguseid andmeid ei saa üheainsa hiireklõpsuga kätte.
Andmete käsitsi ja silmitsi läbi sirvimisest hõlpsama väljanõutamismeetodi leidmiseks katsetasid Särg ja ta kolleegid mitmesuguseid arvutialgoritme ja nende kombinatsioone.
Esimene neist, sisuliselt märksõnaotsing, tegi ära suure eeltöö ja leidis kirjed, milles esines ühes lauses nii raviminimetusi kui ka võimalikke kõrvaltoimeid kirjeldavaid sõnu, keskendudes ses töös lihtsuse mõttes kõigist võimalikest ravimitest vaid antidepressantidele ja antipsühhootikumidele.
Sel moel välja sõelutud kirjetest ei sisaldanud lõviosa aga tegelikult üldse kõrvaltoimete alast teavet.
Nii rakendasid teadlased jätkusõelumiseks paralleelselt paari kangemat algoritmi.
Üks neist oli niiöelda eeskirjapõhine ja analüüsis, kas kirje sisaldas ka sõna kõrvalnäht, kõrvaltoime või kõrvalmõju või kas ravimi nimetus oli seestütlevas käändes, nagu näiteks sõnapaaris leukopeenia klosapiinist.
Teine jätkualgoritm oli masinõppepõhine, mis suutis väljaõppe järel eestikeelset teksti vabalt lugeda ja kirjutada, ilma et talle reegleid ette oleks antud.
Abi oli mõlemast algoritmist, aga masinõppepõhine oli märksa tõhusam kui eeskirjapõhine. Masinõppealgoritmiga sõelale jäänud kirjetest sisaldasid tegelikku kõrvaltoimekirjeldust selgelt rohkem kui pooled.
Nii lähebki ravimite kõrvaltoimete geeniseoste uurijate töö selle võrra lihtsamaks.
Särg ja kaasautorid kirjutavad aga ajakirjas Informatics in Medicine Unlocked, et neil õnnestus oma uuringus kinnitada kolme ravimi puhul juba teadaolevaid seoseid geenivariantidega.


























