Uus tööriist päästab liiga pikkade teadusartiklite lugemisest
Alleni tehisintellekti instituudi loodud tööriist võimaldab võtta arvutiteadust puudutavate teadustööde põhituuma kokku vaid paari lausega. Peagi kavatsetakse intelligentse agendi haaret laiendada ka teistele erialadele, vahendab R2 tehnikakommentaaris Kristjan Port.
Prantsusmaa 17. sajandi matemaatik ja filosoof Blaise Pascal kirjutas seoses uudiskünnise ületanud päevakajalise teemaga mitu kirja, milledest ühele lisas vabanduse "Olin sunnitud kirjutama tavapärasest pikemalt, kuis mul nappis aega teha seda lühemalt."
Mõned aastad hiljem vabandas sarnases võtmes end filosoof John Locke oma essee eessõnas. Kirjatöö sisust leiab vihje pealkirjast "Essee inimese arusaamisest". Ometi tõdes autor pöördumises lugeja poole, et ta ei eita kirjapandud loo liigset pikkust. Kirjapandud lugu osutus pikaks, selle osiseid saanuks lühemaltki edastada ja kordumisi vältida.
Kirjatükk sai siiski kuulsaks hoolimata sellest, et see olnuks inimese arusaamist toetavam. Kirjutajaks oli aga ikkagi inimene, kes lisas ülestunnistusena, et oli liiga laisk või leidus teisi kiiremaid tegemisi mis, välistasid mõtte lühemalt kokkuvõtmise.
Kuulsatest tegelastest on analoogseid vabandusi esitanud muu hulgas Johann Wolfgang von Goethe, Volatire, Winston Churchill, Benjamin Franklin, Mark Twain ja isegi Bill Clinton. Kõrvale võib jätta ehk üliõpilased, kelle hinnangul trumpab nende kirjutatud referaadi pikkus sisu, eelistatakse üldiselt kõikjal lühemat teksti. Seda nii kirjutades kui ka lugedes. See ei tähenda, et eelistus alati teoks saab. Eelnevalt ära toodud mainekad vabandused kõnelevad lühidalt kirjutamisega kaasnevast pingutusest ja ajanappusest.
Elame muutuste ajal ega mõista veel, kas iga uus on hea või mitte. Näiteks on tekkinud kiiretele, kuid kultuurist huvitunud inimestele neid abistavaid raamatuteenuseid. Abilised võtavad lühikestes ülevaadetes kokku kuulsate teoste põhiidee. Teenused aitavad luua mulje sisu teadmisest. Näiteks võib Dostojevski "Kuritöö ja karistuse" võtta kokku järgmiselt – Mõrvaril on teo pärast halb. Ta tunnistab üles. Läheb vangi. Tal hakkab parem. Melville'i "Moby Dick" räägib mehe ja vaala võitlusest, mille vaal võidab jne.
Nimetatud teenuste tekstid on küll pikemad, aga mõte jääb samaks. Oluline on teada, millest raamat rääkis, mitte sellest, kuidas seda tehti. Kirjanikud näevad reeglina kõige rohkem vaeva ja kulutavad aega just viimase kallal. Filigraanse teksti hulk ei tähenda autori saamatust ega loomingulist praaki, vaid lugejale pakutavat rikkust. Just seeläbi ongi need lood kuulsaks saanud, kuigi võinuks kontsentreerida ju Don Quixote lausesse – mees ründab tuuleveskit ja ta on seejuures natuke hull.
Teaduslik tekst püüab liikuda teistsugusel teel. Eesmärk on argumendi sisu võimalikult täpne ja lühike edastamine. Antud ideaali saavutamiseks kulub samuti palju vaeva ja aega. Samas ei saa tänu teatud konventsioonidele kirjutada liiga lühildaselt. Artiklid peavad järgima struktuuri, milles avatakse uuritava nähtuse tausta, tutvustatakse metoodikat, näidatakse andmeid ja alles siis öeldakse, mida kõigest sellest järeldatakse.
Teadusloos on püütud kirjutada lühemalt, kuid läbi raskuste. Kirjastaja ja retsensendid armastavad traditsioone. Mõned erandid on olemas. Kõige lühem teadusartikkel koosneb ainult pealkirjast, mis tutvustab kirjutajaid aeg-ajalt kiusavat tardumist, kui ei sünni paberile ühtegi sõna. Kõik, kes seda artiklit loevad, peaksid probleemist üheselt aru saama, kuis tekstiosas laiutab tühjus.
Leidub veel näiteks ühe valemiga artikkel. Sedagi ei tahetud ajakirja toimetajad kuidagi vastu võtta, kuni autorid neid lõpuks veensid, et valdkonda tundvad inimesed saavad valemi abil koheselt kogu väitest aru, tabades nii ajalugu kui ka metoodilist mõtet. Igal artiklil on ju oma sihtrühm, ülejäänutele polnudki artikkel mõeldud ja pikem tekst poleks neid aidanud.
Meie aega tagasi tulles lisandus siia hiljuti uuendus. Ajale kohaselt on tegemist tehisintellektile toetuva ideega. Teenuse Semantic Scholar taga on Microsofti kaasasutaja Paul Alleni 2013. aastal rajatud Seattle'is tegutsev Alleni tehisintellekti instituut.
Uudsel teenusel on juba üle seitsme miljoni kasutaja. Tegemist on teadusartiklite lugemise tööriistaga. Andmebaasis on umbes 10 miljonit arvutiteaduste valdkonda kuuluvat teadusartiklit. Kasutajaid toob kokku soov saada teada kiiremini ja rohkem kui ise artikleid lugedes. Tehisintellekt loeb teadusliku teksti toodangut inimese eest ja edastab teadlaste mõtte originaalist kompaktsemalt. Näiteks tüüpilise 5000 sõnast koosneva teadusartikli sisu esitatakse 21-sõnalise destillaadina. Keskmine kontsentraat on 1:238-le.
Esialgu loeb AI vaid ingliskeelset teadusteksti arvutiteaduste valdkonnast. Erialade haaret kavatsetakse peagi suurendada. Keele piirang jääb esialgu kehtima, kuis teaduses on nn lingua franca inglise keel.
Kas käeoleva kommentaari saanuks edastada lühemalt? Miks mitte – teemaks oli lühidus.
Esmaspäevast neljapäevani võib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2 saates "Portaal".
Toimetaja: Jaan-Juhan Oidermaa
Allikas: "Portaal"