Sünteetilised andmed heidutavad ideega simuleeritud universumist

Inimeste valmidus kasutada iseõppivate algoritmide treenimiseks välja mõeldud sünteetilisi andmeid näib lisavat kaalu ideele, et universum on simulatsioon, leidub R2 tehnikakommentaaris Kristjan Port.
Kas sa oled robot? Ei! Nii vastaks muidugi ka tõeline robot. Kas mõne inimese puhul painab sind kahtlus, et temas on midagi kahtlaselt ebainimlikku? Kuidas ta vastaks roboti küsimusele? Ilmselt püüaks ta seda eitada. Järsku on tegemist suure robotite korraldatud vandenõuga või simulatsiooniga ehk Nick Boströmi esitatud argumendi tõeks osutumisega? Teisisõnu on võib-olla kõik on üks suur arvutimäng.
Olgu meenutuseks arutluskäik, milles esimene väide tõdeb, et inimkonna võimalus saavutada kõrgema tehnoloogilise ehk tinglikult nimetatuna inimesejärgse arengu tase on lähedane nullile. Antud väite tõeks osutumine mõjuks demotiveerivalt, sest seaks küsimärgi alla, miks on üleüldse pingutada, kui tulevikul on sein ees.
Argumendi teises osas peetakse nullilähedaseks, et isegi kui inimkond saavutaks erakordse tehnoloogilise arengutaseme, huvitaks seda võimekus kasutada tehnikat simuleeritud inimese valmistamiseks, näiteks tema arenguloo uurimise eesmärgil.
Juhul kui need kaks väidet on valed ja kõrge tehnoloogilise arengutaseme saavutamine on tõenäoline, jääb alles valik, milles elavatest inimestest vähemalt osa pärinemine simulatsioonist, on suurem kui null ja läheneb ühele ehk on üpris tõenäoline. Me ei tea ju, kui kaua maailm on eksisteerinud. Teame vaid, mida meile simuleeritakse.
Antud hüpoteetiline võimalus ei anna rahu. Simulatsiooni üle vaieldakse üpris elavalt ja selle eelduseid analüüsitakse tõsise suhtumisega, st kulutades päris raha. Probleem on selles, et ükski hästi tehtud simulatsioon ei tunnistaks end simulatsiooniks.
Meie enesemõistmine läbi maailmakõiksuse kohta oletuste tegemise lisab simulatsiooni uskumisele isegi rohkem kaalu. Selles leidub ju nähtuseid, millega õnnestuks toimuvat endale ja teistele inimestele arusaadavaks teha, aga keegi pole neid nähtuseid suutnud tuvastada. Need asuks nagu teises maailmas, rajaneks millelegi, mis toimib väljamõeldud ehk simuleeritud maailmas. Jutt käib maailmakõiksust kujundavast tumeenergiast ja tumeainest.
Viimane peaks moodustama umbes 85 protsenti kogu teadaolevalt maailmas leiduva massist. Lähtudes füüsik Rolf Landaueri teooriast energia, materjali ja informatsiooni ekvivalentsusest on pakutud, et enamus universumi massist koosnebki informatsioonist või siis moodustab see osa tumedast ainest. Sama Landauer oletas juba 1960. aastatel, et universum võib olla hiiglaslik arvuti, mis simuleerib iseennast.
Jäägu antud poleemika elama oma elu. Nähtusele võiks läheneda hoopiski teise nurga alt ja küsida, kuidas võiks simulatsioon alata. Oletame, et inimkond on jõudmas piisava tehnoloogilise võimekuse piirile. Ta ei mõtle, kuidas simuleerida inimkonna arengulugu, sest lahendamist nõuavad päevakajalisemad probleemid. Näiteks seda, kuidas arendada tehisintellekti algoritme ilma inimeste huve ja vabadusi ohustamata.
Pank või haigla võiks treenida oma inimest teenindama mõeldud süsteemi nutikust klientide ja patsientide andmetega. Mida aga teha, kui töö käigus avastatakse midagi, mis ohustab andmete omanikke? Võimalusi on palju, alates inimesele arusaamatutest ja tema kontrolli alt väljuvatest vigadest, luuakse midagi, millega sekkutakse inimeste eraellu, jõutakse teadmisteni, mida saab rakendada varjatud võimu ja inimestega manipuleerimise eesmärgil jne.
Lähiajaloost on teada juhtumeid, milles tehisintellekt teab rohkem valgenahalistest meestest kui teistest, sest treenimiseks kasutatud andmebaaside kallutatusele, Facebooki tuntakse nii majandusliku kui ka poliitilise manipulatsiooni tööriistana, tehisintellektipõhised ravi toetavad süsteemid on keerulisi raviolukordi päästvate tervendavate juhiste vahele sokutanud eluohtlikke ideid jne.
Nõnda asuti Euroopa Liidus lõppkasutajaid kaitsma, rakendades karme piiranguid neid puudutavate andmete kasutamisele GDPR-lühendina tuntud seadusaktiga.
Päris inimesi kajastavate andmete puudusel jääks tehisintellekti arendamine pooleli. Lahendus peitub sünteetilistes andmetes. Austrias tegutsev MOSTLY AI teebki just seda. Firmas toodetakse kunstlikke andmeid, mida pakutakse masinõppe ja teiste tehisintellekti ülesannete treenimiseks kõikjal maailmas. Andmed on väljamõeldud, aga nende olemus püüab kajastada tegelikkust.
Sünteetiliste andmete äri sai hoo sisse just tänu 2016. aastast loodud GDPR-i piirangutele. MOSTLY AI asutati aasta hiljem. Äsja süstisid riskikapitali koondavad ettevõtted firmasse juba teist korda korraliku rahadoosi. Esimeses ringis toetati firmat ettevaatlikumalt viie miljonit dollariga, nüüd lisati juurde 25 miljonit.
Äri ja võimaluse vaatenurgast oleks tegemist järjekordse innovaatilise algatusega paljude omataoliste seas. Vägisi sünnivad paralleelid mõne filmiga, mille alguses teadlased avastavad midagi normaalselt kasulikku, kuni jõutakse millegi suurema alguse äratundmisele. Siis on aga juba hilja.
Sünteetilisi andmeid kasutatakse tehisintellektil põhinevate rakenduste loomiseks kõikides eluvaldkondades. Loodavad andmed ei saa olla juhuslik numbriline müra, kuna siis õpivad masinad, et inimesel on kuus jalga ja talle meeldib olla kuusekäbidega helikopter vmt arusaamatut.
Sünteetilised andmed peavad kajastama inimest ja tema elukeskkonda võimalikult tõetruult. Nii tõetruult, et kui nendest loodud olevuselt küsida, kas ta on robot, vastaks see – ei!
Esmaspäevast neljapäevani võib Kristjan Porti tehnoloogiakommentaari kuulda Raadio 2 saates "Portaal".
Toimetaja: Jaan-Juhan Oidermaa
Allikas: "Portaal"