Professor: võidujooks parema tehisintellekti nimel varjutab inimkahjud
Viimastel aastatel tehisintellekti ja keelemudeleid saatnud edusammude valguses kiputakse unustama, et need poleks olnud võimalikud madalapalgalise inimtööjõuta, leiab CNRS-i sotsioloogia- ja tehnoloogiaprofessor Paola Tubaro. Lühikeses vaates varjutavad sellega seotud eetikaprobleemid isegi üldtehisintellekti loomisega seotud eksistentsiaalsed riskid.
Viimasel paaril aastal tehisintellekti (TI) vallas toimunud arengute kiirus on pannud kohati ahhetama isegi oma eriala tippe. Neid tutvustavates edulugudes mängivad enamasti peategelasi keset moodsaid kontorimugavusi oma loomepotentsiaali vallandada saanud insenerid, kelle panust aastakümneid kestnud TI-talve lõpetamises ongi raske alahinnata. Kui täpne taoliselt maalitav pilt aga teie arvates on ja mis sellelt puudub?
Me ei tohiks nende saavutusi ka ülehinnata. Suurkujude läbimurrete eeldus on taustatöö, mida ei tehta sugugi mitte ideaaltingimustel. Pean siinkohal silmas kahte valdkonda: andmete märgendamist ja raudvara.
Masinõppealgoritmide ja tehisintellekti treenimiseks tuleb kasutada hästi kirjeldatud andmeid. See nõuab inimtööjõudu. Mõne kuu eest ilmus näiteks The Times'is lugu Kenya töötajatest, kellele maksti ChatGPT-le esitatud küsimuste sisu analüüsimise eest kaks dollarit tunnis. Seeläbi kogutud andmetega loodeti vältida olukordi, kus kasutajad üritavad viia vestlust pornograafilistele ja teistele sarnastele teemadele. Võime küsida, kas see on võimalike kõlvatuste nägemise eest õiglane tasu.
Kirjeldatu pole erand, vaid see praktika on äärmiselt levinud. Reeglina liigitavad andmeid madalapalgalised inimtöötajad mikroskoopiliste tööampsudena, millest igaühe lisandväärtus on väga väike. Tüüpiliselt leitakse need inimesed vaesematest riikidest, mille loodusvarasid kasutatakse tehisintellekti treenimiseks kasutatavate kiipide valmistamiseks.
See toob meid raudvara juurde. Algoritmide treenimine nõuab suurt arvutusvõimsust, milleks on omakorda vaja palju energiat. Sõltuvalt asukohast võib paiskuda selle käigus õhku rohkelt CO2-te. Kiipide valmistamiseks on vaja mitmeid eri metalle ja nende kaevandamine ongi hoogustunud. Globaalses lõunas on kaevurite töötingimused aga taas ideaalist kaugel. Tehisintellekti võidukäik oleks samas ilma nendeta sellisel kujul võimatu.
Veel hiljuti ennustasid eksperdid, et tehisintellekt ei hakka vähemalt esialgu tööd ära võtma kahte tüüpi töötajatelt. Turvalisemalt võivad end tunda suuremat loovust ja kriitilist mõtlemist nõudvatel ametikohtadel töötavad valgekraed. Samuti füüsilise töö tegijad, vähemalt kuni robotid odavamaks ei muutu. Teie mõttekäigu kohaselt leidub aga veel kolmas klass töid, mida ilmselt ka praegune keskklass rohkem tegema peab. Prantsusmaa näitel on paljudel taolise mikrotöö tegijatel tegelikult kõrgharidus.
Juba praegu teevad mikrotööd sageli inimesed, kellest me seda ei ootaks. Näeme seda nii Prantsusmaal kui ka Ladina-Ameerikas, kus on ülikooliharidusega inimestega osakaal lääneriikidest märksa väiksem. Samas teenivad nad andmete märgendamisega tulu märksa sagedamini kui sealne elanikkond keskmiselt.
Osaliselt on tingitud see nende riikide majanduslikust olukorrast. Näiteks Venezuelat ja Argentinat kimbutavad praegu hüperinflatsioon ja valuutakriis. Nende elanikud teevad mikrotööd puhtalt seetõttu, et teenida püsiva väärtusega dollareid, kuigi teenitav tasu on naeruväärne. Alternatiiv oleks võtta tavatööd tehes oma palk välja kohalikus rahas, mille eest iga päev ühe vähem osta saavad.
Iroonilisena teevad seda tüüpi tööd isegi arvutiinsenerid, kelle mõju ja palk võiks olla mõnes muus riigis palju suurem. See on üks näide, kuidas tehisintellekt juba praegu tööturgu muudab. See ei jäta inimesi otseselt tööta, kuid meelitab neid olude sunnil elualadele, mille lisandväärtus ei pruugi olla klassikalises mõttes kuigi suur.
Täiendava kitsaskohana pole võimalik mikrotöötajatel seejuures praegu oma töös kasutatavaid kompetentse ja oskusi võrrelda. Nad ei suuda enam hoomata, kas neile makstakse nende töö eest piisavalt õiglast tasu. Lõuna-Ameerika riikides nõuab lisaks oma tasu kätte saamine kõrget finantskirjaoskust. Skeemitada tuleb krüptovaluutadega või jääda lootma USA-s elavatele vahemeestele ja mustale turule.
Viimaks, inimesed ei tee tööd pelgalt raha pärast. Kasutame seda nii end inimesena arendamiseks kui ka sotsialiseerumisvajaduse rahuldamiseks. Mikrotööplatvormide eripära tõttu ei pruugi töötajad teada, kes on nende kolleegid ega isegi seda, kelleni nende töö lõpuks jõuab. Paraku pole veel valdkondlikke uuringuid, kuidas mõjub see meie vaimsele tervisele ja produktiivsusele. Klassikalist tööd puudutavate uuringute põhjal pole aga ilmselt midagi head loota. Horisontaalse teadmussiirde seisukohalt on väga oluline, kui saad piltlikult oma kollegi õlale koputada.
Mida tähendab see üleilmse ebavõrdsuse mõttes? Arengumaad on kulutanud hulga raha, et needsamad spetsialistid raviksid näiteks haigeid, ehitaks üles riiklikku taristut või pakuksid ühiskonnale muud lisandväärtust. Välisfirmadele mikrotööd tehes jääb see investeering tagasi teenimata. Kuidas seda vahet õiglaselt hüvitada? Kuigi näiliselt on märgendamine lihtne töö, saavad sellega hakkama siiski praegu ainult inimesed ehk tegu on justkui millegi eksklusiivsega.
Mulle tundub, et suured IT-ettevõtted ei taha praegu väga tunnistada, kuidas millegi automatiseerimiseks tuleb teha esmalt tohutul palju tööd inimeste jõul. Selle asemel näeme fantastilist narratiivi automatiseerimisest ja üha paremaks muutuvatest tööriistadest. Tehnoloogiasektoris nähtava konkurentsi tihedusega arvestades on see muidugi loomulik.
Mulle jääb vahepeal aga isegi mulje, et annoteeritud andmeid kasutavad spetsialistid ei mõtle sellele, kust need andmed tulevad. See on tihti ärisaladus, ent ettevõtted ostavad tihti suuremaid andmekomplekte teistelt ettevõtetelt, kes tegid ära musta töö. See on minu jaoks problemaatiline, kuna viib vastutuse hajumiseni. Mikrotöid vahendavad ettevõtted ja platvormid ei tee inimeste rollist saladust. See on osa nende turundusstrateegiast.
Eetilisest küljest võiksime võrrelda seda ahelat spordiriiete valmistamisega. Sageli toodetakse neid arengumaades, nagu Bangladeshis, mil neid müüakse ning ostetakse Euroopas ja Põhja-Ameerikas. Hakkasime sealsetest probleemidest rääkima alles siis, kui mõni sealne tehas inimohvritega maha põles. Me ei peaks seega mõtlema ainult sellele, mis juhtub nende algoritmide tõttu, näiteks ChatGPT avalikku kasutusse andmisel, vaid ka sellele, mida ChatGPT loomiseks tehakse.
Peame seejuures silmas pidama, et oleme taolist tormamist näinud sugugi mitte esimest korda. Lugesin hiljuti 2017. aastal tehnoloogiaajakirjanduses avaldatud lugu sellest, kuidas kohe-kohe hakkab põhinema kõik häälkäsklustel. Seda ei juhtunud. Aasta varem lubati isejuhtivaid autosid. Suured keelemudelid ja juturobotid on minu arvates selle viimane näide.
Arvestades, et Amazoni sõnu kasutades ei kao tehisintellekti intellekt lähiajal kuhugi, millised on mõned konkreetsed sammud, millega oleks võimalik muuta praegust asjade korraldust õiglasemaks? Siinkohal tuleb rõhutada, et patust priid pole ka teadlased ise, kes kasutavad platvorme nagu Mechanical Turk, ilma milleta oleks odavteaduse tegemine nii psühholoogia valdkonnas kui ka mitmel pool mujal sellises mahus võimatu.
Arvan samuti, et mikrotöö mõju ulatub tehisintellekti valdkonnast märksa kaugemale. Teadlased kasutavad sarnaseid platvorme küsitluste ja eksperimentide tegemiseks, sest see on samamoodi lihtsam ja odavam. Peaksime endale ses osas tuhka pähe raputama või vähemalt seda meeles pidama. Me oleme kõik rahahädas, kuid see ei peaks tulema teiste, veelgi suuremas hädas olevate inimeste arvelt.
Näen ise paari erinevat lahendust, neist mõned on teistest radikaalsemad. Hakatuseks peaksime aga sedasorti tööd hallist alast välja saama. See võimaldaks meil paremini mõista, mida mikrotöötegijad üleüldse vajavad ja kuidas erineb see näiteks toidukulleri või Uberi autojuhina töötamisest. Viimase osas toimus läbimurre alles paari aasta eest, kui need inimesed tänavale protestima tulid. Probleem pole kuhugi kadunud, kuid vähemalt liigume õiges suunas.
Mikrotöötajatega on raskem, sest neid pole isegi tänavapildis ja nende murede teravus erineb riigiti. Ühtlasi puudub neil praegu koht, kus organiseeruda. Amazoni Mechanical Turki töötajaid saatis edu vaid seetõttu, et neile ulatasid abikäe ametiühingud ja aktivistid. Seejuures asub suur osa selle tööjõust USA-s. On raske näha, et lääneriikides viitsiksid tänavatele tulla inimesed, kes teenivad mikrotööga lisaraha paar tundi nädalas. Eeskätt puudutab see arengumaid, kus on mikrotöö palju sagedamini nende inimeste peamine töökoht.
Ühtlasi peame tunnistama, et tehisintellekti jaoks tarvilike andmete märgendamine nõuab erioskusi. Nende parandamiseks on vaja kohti, kus saaksid seda tüüpi töö tegijad kokku tulla ja kogemusi vahetada. See aitaks kõigil rohkem teenida, ent ka neid resotsialiseerida, isegi Euroopas. Need sammud on nii iseenesestmõistetavad, kuid ka kiireloomulised.
Radikaalsemana oleks vaja ümber mõtestada, mida tehisintellekt teeb ja milleks me seda arendame. Minu vaatenurgast ei kujuta see praegu inimkonnale eksistentsiaalset ohtu, nagu arvavad mõned eksperdid. Eeskätt ähvardab suurendada see ebavõrdsust eri riikide ja sotsiaaldemograafiliste rühmade vahel.
Kui näeme neid mustreid juba selle treenimise juures, kehtib see ilmselt ka selle kasutamise puhul. Praegu on rambivalguses keelemudelid. Mäletame loodetavasti aga kõik sellele eelnenud vaidlusi diskrimineerimise automatiseerimise üle. Kui algoritmid tunnevad paremini ära valge nahaga inimesi ja pigem mehi kui naisi ning tumedama nahaga inimesi, ei ole see meist mõne jaoks väga hea maailm, kus elada.
Kes peaks vastavaid debatte eest vedama? Kuna tehisintellekti armastatakse viimasel ajal võrrelda tuumarelvadega, võiksime ühelt poolt eeskuju tuumarelvade leviku tõkestamise konventsioonist. Arvestades, et näiteks USA Kongressi ärakuulamistel küsitakse aga nõu inimeste nagu OpenAI direktori Sam Altmani käest, vastaks see sellele, et konsulteeritakse vaid tuumariikidega. Samas ei näe me neil kuulamistel inimesi, kelle argielu see otseselt puudutab, nagu mikrotöö tegijaid. Kui esinduslik peaks regulatsiooni kavandamisel olema?
See on tõeline probleem. Suurt osa TI-eetikat puudutavatest väitlustest juhivad ettevõtted ise. Ennast ise reguleerides väheneb võimalus, et nad peavad ühel hetkel alluma palju rangematele, riikide kehtestatud regulatsioonidele. Samas ei pruugi lahendada need kõiki probleeme, vaid pelgalt neid, millega on neil lihtne toime tulla. Me ei peaks vaikimisi ootama, et suurettevõtete ja ühiskonna huvid selles vallas kokku langevad.
Selle ühe näitena avaldati mõne aasta eest uuring, kus teadlased vaatasid TI-eetika teekaarte, mida on eri osalised, alates ettevõtetest lõpetades vabaühingute ja konsortsiumitega aegade jooksul loonud. Tuli välja, et need kõik olid erinevad. Seejuures ei pööranud suurem osa ettevõtete kavadest tööjõule ega jätkusuutlikkusele mingit tähelepanu.
Märksa enam käsitleti näiteks läbipaistvust. See pole halb, kuid see on vaid osa protsessist, mis tööstuses laiemalt juba aastaid käib. Ent see ei lahenda kõiki murekohti. Liiatigi, kui vaadata mõisteid lähemalt, ei saa kõik läbipaistvusest samamoodi aru.
Paljud riigid üritavad luua mingisugust üldist kõikehaaravat käsitlust, mis on väga tervitatav. See peaks hõlmama aga rohkem osalisi ühiskonna eri osadest, mitte pelgalt USA suurettevõtete esindajaid.
Palju teil endal tööstusega otsekontakte on ja kas nad on üleüldse sellest huvitatud, millest te räägite? Elame mõnes mõttes paradoksaalsel ajal, ühest küljest on meie käsutuses võimsamad TI-tööriistad kui kunagi varem. Samas on tabanud mitmeid valdkonna ettevõtteid juba majandussurutis ja kulude vähendamiseks lastakse mitmel pool esimesena lahti just eetikaga tegelevad töörühmad.
Turg on raskes seisus. Praegu on iduettevõtetel lihtsam esmaseks arendustööks raha saada kui suurettevõtetel oma pikaajalisemate projektide teostamiseks. Samas on väiksematel ettevõtetel palju raskem saada ligipääsu piisavalt suurtele ja kvaliteetsetele andmebaasidele. Neil pole selleks lihtsalt piisavalt raha. Nad peavad leppima avalike andmebaasidega või nendega, mida on juba varem teised kasutanud. See omakorda tähendab, et nende loodavad lahendused on juba eos vähem konkurentsivõimelisemad.
Teine külg on arvutusvõimsus, mille puhul on suurettevõtetel samuti väga selge eelis. Samamoodi on kehvemas seisus arvutiteaduse ja -inseneeria vallas tegutsevad uurimisinstituudid. Arvan aga, et just sel põhjusel on mõnikord väiksemate ettevõtetega lihtsam suhelda. Nad teavad, et ei saa taoliste klassikate mõõdikute vallas suurettevõtetega, nagu Google'iga võistelda. Nad loodavad teadusringkondadega koostööd tehes konkurentsieelist saavutada või spetsialiseeruvad niššidele, millele pole suurtes äriprojektides tähelepanu pööratud.
Võib-olla oleks neil näiteks abi kleepsudest, mis näitavad kohe ära, et "see tehisintellekt mudel loodi eetiliselt ja töötajad said õiglast tasu", midagi sarnast õiglase kaubandust ideele.
See võib-olla lahendus. Mõned andmete märgendamisega tegelevad ettevõtted ja platvormid on näiteks välja töötanud eetikakoodeksid, näitamaks, et nad kohtlevad nende lahenduste aluseks olevat tööjõudu õiglaselt. Need arengud on tervitatavad, kuid nende mõju on olnud seni piiratud. Me ei näe tööstuses laiemat debatti. Oma roll peaks olema seejuures ka ettevõtete aktsionäridele, muidu on tulemus taas kallutatud.
Milline on aga teie sõnum lõppkasutajatele, kes kasutavad praegu ChatGPT-d enda meele lahutamiseks või argitöös? Millele nad mõtlema peaksid?
Peamisena ei tohiks me arvata, et tegu on võlukunstiga. Isegi kui valdkond ja taoliste tööriistade kasutamine on põnev, kütkestav ja see kõik paista meile muinasjutuline. Peaksime olema ettevaatlikumad ja mõtlikumad, kasvõi rohkem fakte kontrollima ning mõtlema sellegi peale, kuidas need tööriistad sündisid. Sellel kõigil oli mõju looduskeskkonnale ja inimestele endile. Jah, neist tööriistadest on kasu, kuid me ei peaks kasutama neid nagu kevadel koplisse lahti lastud vasikad.
Paulo Tubaro osales rahvusvahelise humanitaar- ja sotsiaalteadlaste koostöövõrgustiku CHANSE kick-off-konverentsi tehisintellekti puudutavas arutlusringis.