Tehisaru aitab Eesti teadlastel kaardistamata kuivenduskraave tuvastada

Tartu Ülikooli (TÜ) maastikugeoinformaatika töörühma teadlased rakendasid maa- ja ruumiameti loodud digitaalsel maapinna kõrgusmudelil tehisaru, et automaatselt kaardistada maastikus kuivenduskraavid. Töö näitas, et ühe piirkonna andmete põhjal suudab mudel õppida edukalt kraave leidma teistestki piirkondadest.
Miks on vaja kuivenduskraave kaardistada?
Eesti on kaetud üsna tiheda kuivendusvõrguga, mis juhib põldudelt ja metsamaadelt ära liigvett. Tavaliselt me kuivenduskraavidele tähelepanu ei pööra, sest kui need on töökorras, on maapind põllu- ja metsatöödeks piisavalt kuiv.
Probleemid tekivad siis, kui kuivenduskraavid ei tööta enam hästi, sest need on kas kinni kasvanud või kogemata kinni aetud. Sellisel juhul hakkab liigvesi põllukultuuridele või metsas kasvavatele puudele liiga tegema.
Kuivenduskraavid mõjutavad ka oluliselt kasvuhoonegaaside heitmeid, eriti metaani (CH4) ja süsinikdioksiidi (CO2) voogu. Põllumajanduspiirkondades võivad kraavid mõjutada ka dilämmastikoksiidi (N2O) emissioone. Seetõttu on kraavide olemasolu ja asukoha teadmine vajalik kasvuhoonegaaside koguste hindamisel maakasutuse, maakasutuse muutuse ja metsanduse (LULUCF) sektoris.
Traditsiooniliselt on kraave kaardistatud kas välitöödel või käsitsi aerofotodelt digitaliseerides. Need meetodid on aga väga aeganõudvad ja eriti keerulised metsades, kus puuvõrad varjavad kraave. Kuna kraavid on sageli kitsad, madalad ja taimestikuga kaetud, on nende täpne ulatus tavapäraste meetoditega raskesti tuvastatav. Kohtades, kus kraavivõrk suhteliselt lühikese aja jooksul oluliselt muutub, näiteks turbaväljadel, ei ole seda seni üldse kaardistatud.

Kuidas tehisaru õpetada kraave ära tundma?
Viimastel aastatel on maa- ja ruumiameti tehtav aerolaserskaneerimine võimaldanud luua maastikest täpseid kolmemõõtmelisi punktipilvi laserimpulsside abil. Nendest omakorda on loodud digitaalne kõrgusmudel, mis kujutab maapinna kõrgust ilma taimestikuta. Seda kõrgusmudelit saab edukalt kasutada kraavide tuvastamiseks tehisaru abil.
Tartu Ülikooli maastikugeoinformaatika töörühm kasutas süvaõppe meetodit U-Net, mis on konvolutsioonilise närvivõrgu (CNN) üks paljudest meetoditest. U-Net suudab väga täpselt tuvastada väikseid ja kitsaid objekte, analüüsides pildi tekstuuri ja pikslite konteksti erinevatel skaaladel.
Selleks, et süvaõppe mudel oskaks kõrgusmudelist kraave leida, tuleb seda eelnevalt treenida. Selleks on vaja suures koguses märgendatud treeningandmeid: mudelile tuleb öelda, mis on kraav ja mis ei ole. Sageli pole aga selliseid andmeid saadaval.
Andmete märgendamine on enamasti käsitöö ja see on väga aeganõudev, sest märgendada oleks vaja tuhandeid kraave. Selle probleemi lahendamiseks kasutati siirdeõppe meetodit. Viimane hõlmab olemasolevate treeningandmete kasutamist andmerikkast piirkonnast, et süvaõppe mudelit nende abil n-ö ette õpetada. Seejärel saab juba peenhäälestada seda väiksema hulga kohalike andmetega.
Äsja valminud töös kasutati U-Net mudeli eeltreenimiseks suuremahulist kvaliteetset Rootsi märgendatud kraavide andmestikku. Seejärel kohandati mudelit väiksema Eesti andmestikuga. Eesti treeningandmed koguti kahelt 3x3 kilomeetri suuruselt alalt, mis hõlmasid nii metsa-, põllu- kui ka turbaalasid.

Kui hästi suutis süvaõpe kraave tuvastada?
Kui seni oli Eesti Topograafia Andmekogus u 150 000 kilomeetri jagu kraave, siis süvaõppega leiti neid juurde ligikaudu 45 000 kilomeetrit. Kindlasti jäi ka omajagu kraave veel tuvastamata.
Parim kohandatud mudel suutis tuvastada u 77-protsendise täpsusega. Mudeli täpsus varieerus sõltuvalt maakasutusest, olles kõrgem ehk üle 80 protsendi turbaaladel ning kõige madalam ehk 75 protsenti metsades.
Metsastel aladel ei olnud süvaõppemudel nii edukas seetõttu, et kõrgusmudelis ei tule metsas kraavid nii hästi esile nagu lagedatel turbaväljadel või põldudel. Puude võrad segavad natuke aerolaserskaneerimist ning kõrgusmudelis esineb müra.
Teisalt võib vahel juhtuda, et aerolaserskaneerimise hetkel on kraav vett täis ja sellisel juhul ei tule samuti kraav kõrgusmudelis hästi esile isegi taimestikuta aladel. Mudeli tulemusi saaks parandada sellegagi, kui lisada Eestist juurde treeningandmeid ja seda eelkõige metsades. See eeldaks aga suures mahus käsitööd.

Turbaväljadel suutis süvaõpe väga hästi kraave tuvastada, sest seal ei ole segavat taimestikku ning kraavid on kõrgusmudelis väga selged. Vasakul on näha turbavälja kraavid ortofotol ja punasega Eesti Topograafi Andmekogus (ETAK). Paremal on helesinisega lisatud süvaõppe mudeli tuvastatud kraavid.

Süvaõppemudel suutis tuvastada palju kaardistamata kraave ka metsades. Kuna aga kõrgusmudel on seal puudevõra tõttu mürarikkam, on mudeldatud kraavid turbaväljadega võrreldes katkendlikumad. Vasakul on näha metsa kraavid ortofotol ja punasega Eesti Topograafia Andmekogus (ETAK). Paremal on helesinisega lisatud süvaõppe mudeli poolt tuvastatud kraavid.
Seega näitab teadustöö, et siirdeõppega saab edukalt kasutada olemasolevaid süvaõppemudeleid neid kiiresti ja väheste andmetega kohalikele oludele peenhäälestades. Sellega ületati tehisaru kasutamise üks peamisi kitsaskohti ehk treeningandmete loomise töömahukus.
Uuring ilmus ajakirjas Big Earth Data.
Toimetaja: Airika Harrik