Miljoneid teadusartikleid ähvardab oht veebiavarustest kaduda
Teadusartiklite nii-öelda digitaalsete isikukoodide analüüs osutab, et teadustulemusi avaldatakse rohkem, kui neid arhiveerida jõutakse. Mure kimbutab pigem väiksemaid kirjastusi, kel napib raha ja võimet suurt hulka avaldatud materjali pikaajaliselt säilitada.
Enam kui neljandikku kõigist teadusartiklitest ei arhiveerita ega säilitata veebis korralikult, selgus enam kui seitsme miljoni digitaalse publikatsiooni analüüsist. Tulemustest osutub, et veebi talletusvõimalused pole suutnud üha kasvava uute artiklite tulvaga sammu pidada, vahendab Nature News.
Uue uuringu autori ja digitaristu organisatsiooni Crossref arendusega seotud Londoni Ülikooli teaduri Martin Eve'i sõnul põhineb teaduses kogu tunnetusteooria allmärkuste jadal. Teisisõnu peab artikli autor suutma tõestada, et keegi on mõne mõtte juba varem sõnastanud. Vastasel juhul toetub autor pelgalt kõhutundele ja talle tegelikult kättesaamatutele teostele.
Uue analüüsi tarbeks koondas Eve valimisse 7 438 037 teadustööd. Ta kontrollis üle, kas kõik need uurimused on talletatud mõnda veebiarhiivi. Kõik uuritud tööd olid varustatud objekti digitaalidentifikaatori ehk DOI-ga. See on numbrite, tähtede ja sümbolite jada, mis toimib nagu elektroonilise dokumendi isikukood. DOI-d võimaldavad teadustöid üheselt kindlaks teha ja viitena enda töösse põimida.
Valimisse võetud uurimustest polnud 28 protsenti ehk üle kahe miljoni artikli kättesaadavad üheski suuremas digitaalses arhiivis, ehkki publikatsioonil oli kehtiv DOI. Vähemalt ühes arhiivis tallel olevatele töödele viitas vaid 58 protsenti DOI-dest. Ülejäänud 14 protsenti artikleid jäi lõpuks uurimusest välja, sest nende avaldamisest oli möödas liiga vähe aega, need polnud ajakirjaartiklid või siis polnud võimalik kindlaks teha nende algallikat.
Tulemused ei tähenda, et artiklid poleks veebis üldse leitavad. Näiteks võivad need olla olemas kirjastajate veebilehel. Kui kirjastaja peaks aga pankrotti minema või juhtuda midagi selle serveritega, võivad vastavad teadustööd veebiavarustest kaduda.
Probleemi ulatuse hindamiseks uuris töörühm, kuidas erineb olukord kirjastate lõikes. Vähemalt 75 protsenti kogu oma avaldatud sisust hoidis kolmes või enamas arhiivikeskkonnas vähem kui üks protsent kirjastajaid. Alla kümne protsendi kirjastustest talletas lõviosa avaldatud töödest vähemalt kahes keskkonnas. Kolmandik uuritud kirjastustest ei tegelenud aga üldse järjekindla arhiveerimisega.
Säilitamisprobleem
Martin Eve'i sõnul peab tema analüüsi lugema teatavate mööndustega. Nimelt hõlmas uuringu valim üksnes DOI-ga varustatud artikleid. Samuti ei vaadanud ta analüüsi tarbeks läbi kõiki digitaalseid artiklihoidlaid, näiteks teadusasutuste endi arhiivikeskkondi.
Mööndustest hoolimata peavad tööga mitte seotud talletamisspetsialistid analüüsi tervitatavaks. Näiteks ütleb ise Helsingi Hankeni majanduskoolis teaduspublitseerimist uuriv Mikael Laakso, et paljud inimesed usuvad pimesi, nagu tagaks DOI olemasolu artiklile igavese kättesaadavuse. Koos kolleegidega näitas ta 2021. aastal, et tegelikult kadus aastatel 2000–2019 internetiavarustest üle 170 avatud ligipääsuga ajakirja.
Digitaalse arhiiviteenuse pakkuja Portico tegevdirektor Kate Wittenberg hoiatab, et suutmatus artikleid säilitada ohustab pigem väikesi kui suuri kirjastusi. Avaldatud sisu talletamine maksab raha ning selleks on vaja taristut, tehnoloogiat ja teadmisi, mida väikestel organisatsioonidel pole.
Eve pakub oma analüüsis välja meetmeid, mis aitaksid digitalletamist parandada. Näiteks võiksid DOI-de registreerimisele olla seatud karmimad nõuded. Samuti tasuks Eve'i sõnul tõsta nii kirjastajate kui ka teadlaste endi teadlikkust säilitamisprobleemist.
Uuring avaldati ajakirjas Journal of Librarianship and Scholarly Communication.
Toimetaja: Airika Harrik