Väikese kõnelejaskonnaga keelt on tehisarul lihtsam õppida
Mõnikord paneb ikka veel imestama, kui hästi oskab tänapäevane tehisaru inimkeeles kirjutada: mõnikord ei saagi kohe aru, et teksti autor on tegelikult algoritm.
Nüüd on Saksa teadlased lähemalt uurinud, kui hõlpsalt läheb erisugstel tehisarualgoritmidel erisuguste inimkeelte kasutamise oskuse omandamine, ja tulemused sisaldasid kenakese üllatuse.
Selgub nimelt, et tehisarul on kergem omandada neid keeli, mille kõnelejate arv on väiksem, ja raskem neid, millel on kõnelejaid rohkem.
See tulemus näib minevat otsesesse vastuollu seniste arusaamadega keele kõnelejate arvukuse ja keele selgeks õppimise raskuse seostest.
Alexander Koplenig ja Sascha Wolfer Mannheimis asuvast Leibnizi saksa keele instituudist lasid tehisarudel õppida ligi kaht tuhandet maailma keelt.
Tehisarud õpivad keeli suurte tekstimassiivide põhjal, milles nad otsivad ja leiavad seaduspärasusi. Niinimetatud transformer-tüüpi arud nagu näiteks hästi tuntud ChatGPT õpivad pikapeale üha paremini ette ennustama, kuidas tekst mingist kohast edasi läheb.
Katsest ilmnes, et eri keelte puhul vajasid arud vastuvõetava pädevustaseme omandamiseks erisuguses koguses lähteteksti, ja mida suurema kõnelejaskonnaga keel, seda rohkem lähteksti kulus.
Seos kõnelejate arvu ja õppeteksti mahukuse vahel jäi kehtima ka siis, kui teadlased kõrvaldasid kõrvaliste tegurite, nagu keelte omavahelise suguluse või kõnelejaskonna üldise geograafilise paiknemuse mõju, samuti õppetekstide kvaliteedist tulenenud erisused.
Miks see nii on, teadlased ei tea. Seni on keeleteadlaste seas valitsenud kaks hoopis teistsugust seisukohta.
Üks teooria on olnud, et kõik keeled on tegelikult enam-vähem ühe keerukad.
Teise teooria järgi on suure kõnelejaskonnaga keeled ajapikku lihtsustunud, sest nende keelte rahvusvahelise kasutatavuse pärast õpitakse neid tihti alles täiskasvanueas, mil keerukate grammatikakonstruktsioonide selgeks saamine võib olla vaevalisem kui lapseeas.
Nüüd saadud tulemus on täiesti ootamatul moel nende mõlemaga vastuolus.
Võimalik seletus võib peituda asjaolus, et tehisaru jaoks on keeleõpe ikka midagi täiesti muud kui inimese jaoks. Võib ju arvata sedagi, et keel kui nähtus üleüldse on masina jaoks midagi hoopis muud kui meie jaoks.
Ent olgu kuidas on, Koplenig ja Wolfer annavad oma tulemustest teada ajakirjas Scientific Reports.