Haigeid lapsi tasub lasta diagnoosida vaid süvakoolis käinud tehisarul
Kaks hiljutist uuringut näitlikustavad, et erinevused treeningmaterjalis mõjutavad märkimisväärselt tehisaru täpsust haigetele lastele diagnoosi panemisel. Kui üheljuhul jääb tulemus alla isegi guugeldamisele, siis teise tehisaru võimekus on võrreldav lihast ja luust arstidega, vahendab R2 tehnikakommentaaris Kristjan Port.
Alanud aastal tasub seada end valmis vaimu ja emotsioone kurnavaks poleemikaks tehisintellekti rakendamisest arsti ametis. Lootus parima arstiabi saamiseks on vähemalt paartuhat aastat rajanenud väikese hulga spetsialistide koolitamisele ajastu parimate teadmistega, kes siis omakorda asusid aitama tuhandeid inimesi. Õppimise olemus kujutas endas kohtumist teadmatuga, õppimist vigadest ja teadmiste tähelepanelikku kasutamist.
Arsti tööst moodustab tänapäeval olulise osa teadmiste ja kogemuste kombinatsioonina kujunenud tarkuse rakendamine patsiente kirjeldavatele andmetele. Mõned juhtumid on lihtsamad ja ravi võib pidada üsna masinlikuks. Arsti eriala väärtus kasvab aga tarkusest, millega lahendatakse keerulisi ja elutähtsaid juhtumeid. Neist eriliselt keeruka väljakutse moodustavad laste haiguste diagnoosimine ja ravi, seda mitmel põhjusel.
Laste võimekus oma sümptomeid selgitada ja tundeid väljendada on piiratud. Kiire kasvu ja pidevate muutuste tõttu võivad nende testide väärtused ning normaalsed vahemikud suuresti erineda. Lastel võivad haiguste sümptomid esineda täiskasvanutest ka erinevalt. Enamik geenihäiretest avaldub samuti varajases lapsepõlves. Neil on väiksem füsioloogiline reserv, mille tõttu võib haigus süveneda kiiremini, laste keha reageerib ravile ning ravimitele erinevalt jne. Ühesõnaga, lapsed ei ole väikesed täiskasvanud.
Oodatavate vaidluste hädaks saab olema, et osapooled valivad tõendeid valgustamaks oma mõtterada, mitte tegelikkust. Näidete valik suureneb, sest alanud aastal valmib oodatavalt kümneid hiljuti alustatud vastavateemalisi uuringuid. Olgu valikuna toodud kaks suhteliselt värsket uuringut, mille vastuolulised tulemused illustreerivad vajadust olla tähelepanelik ning suhtuda toodud väidetesse ettevaaltikult ning õpihimuliselt.
Kummagi teadusliku uuringu eesmärgiks oli uurida, kui hästi oskab tehisintellekti rakendus diagnoosida laste haigusi. Mõlemad uuringud avaldati auväärsetes teadusajakirjades. Üks vastavalt USA Arstide Liidu väljaandes Journal of American Medical Association ja teine ajakirjas Nature Medicine.
Esimeses uuringus esitati vestlusrobotile ChatGPT saja juhuslikult valitud haigusloo kirjeldused ja seejärel paluti sel esitada võimalik diagnoos. Valitud juhtumid olid varem arstide poolt edukalt läbitöötatud. Uuringus ei kasutatud inimestest võrdlusrühma, kellele oleks samuti antud vaid sümptomite kirjeldus sooviga saada nende põhjalt diagnoos. Antud üksikasja muudab oluliseks ChatGPT üllatavalt halb tulemus. Tulemusi peaks võrdlema reaalse arsti tulemusega. Nagu tõdetud, pediaatriline diagnostika on keeruline väljakutse.
ChatGPT pakkus välja kõigest 17 korrektseks peetud diagnoosi. Ülejäänu osas hindasid kaks eksperti diagnoosi liiga üldiseks või täiesti valeks. Saadud tulemus jõuab ilmselt meedia kaudu avalikku teadvusesse ja muundub seal kindlaks seisukohaks, et tehisintellekt arsti tööks ei sobi.
Võimalikes vestlustes unustatakse, et tegemist oli katsega proovile panna internetist kogutud tekstist õppinud masina pädevus lastehaiguste diagnoosimisel. Antud uuringust ei saa teada inimesest erialaspetsialisti tulemusi, mis peaks eeldatavalt olema paremad, aga kui palju? Teiseks ei saa sellest uuringust midagi teada, kui antud GPT mudel õpiks panema diagnoose seda eelnevalt laste haiguslugude pealt treenides.
See toob lubatud teise teadusartikli juurde. Kirjeldatud uuringu puhul oli suure keelemudeli õppematerjaliks erakorralise meditsiini osakonda jõudnud 1 362 559 lapspatsiendi visiidi käigus kogutud 101,6 miljon andmepunkti. Uurimuse tulemusel leiti, et tehisintellekti mudeli diagnostiline täpsus oli levinud lastehaiguste diagnoosimisel võrreldav kogenud lastearstidega.
Uuringus võrreldi tehisintellekti diagnostilist täpsust viie arstidest rühma koostatud diagnoosidega. Arstidest koosnevate rühmade tulemused jäid 84–92 protsendi vahele. Raviprotsessi õppinud masina tulemus oli 89 protsenti ehk võrreldav arstide keskmise tulemusega.
Tervishoid on sotsiaalselt tundlik ja oluliste huvigruppide mõjutatav valdkond. Juhituna tehisintellekti potentsiaalist, sisenevad sellesse seni tervishoiuvälise taustaga uued osapooled. Kuigi kõigi eesmärk on muuta tervishoiu teenuseid senisest paremaks, sisaldab üleminekuprotsess nii palju vasturääkivaid näiteid, et kardetavalt see asjaolu ununeb ja valmistuma peab valusaks, tervist kahjustavaks rüseluseks.
Esmaspäevast neljapäevani võib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2 saates "Portaal".
Toimetaja: Jaan-Juhan Oidermaa
Allikas: "Portaal"