Targad andmed aitavad langetada paremaid ja teadlikumaid otsuseid

Federico Plantera

Uudiseid loetakse, sotsiaalvõrgustikes võetakse sõna või poes osteldakse küll eri põhjustel, kuid selles kõiges on ka midagi ühist: niisuguse tegevuse käigus toodetakse andmeid. Infoühiskonnas on andmed mitmel tasandil ja pidevalt muutuva tegelikkuse jalajälg. Iga päev toodetavat suurt teadmiste hulka aga on vaja kirjeldada ja analüüsida. Nõnda saab statistikast – sotsiaaldemograafilistest näitajatest majandustulemusteni – nii äri kui ka poliitika võimas tööriist.

Järjest keerukama digielu tõttu on vaja neid, kes võtaksid põhiandmete lahtimõtestamisel ja tõlgendamisel juhtrolli. Nende hulgas on väga tähtis osa riiklikel statistikaametitel kui näitajate ja värskeima info ametlikel allikatel. Mart Mägi juhib Eesti statistikaametit, riigiasutust, mille eesmärk on saada aastaks 2022 kõige uuenduslikumaks ja tõhusamaks usaldusväärse statistika tootjaks Euroopas.

Tööd selle nimel märgivad ka ÜRO Euroopa majanduskomisjonile hiljuti esitatud soovitused statistika tuleviku kohta muutuvas andmete ökosüsteemis. Kooskõlas OECD juhistega peab peadirektor Mart Mägi parimaks tegutsemisviisiks tarka andmehaldust. Intervjuus selgitab ta, kuidas tehnoloogiat ja uusi analüütilisi käsitlusi kombineerides võib nii avalikus kui ka erasektoris jõuda asjatundlikumate ning teadlikumate otsuste langetamiseni.

Mart Mägi, statistikaameti peadirektor

Allikatest näitajateni on tekkimas uus andmete ökosüsteem. Kuidas seda muutuvat olustikku kirjeldada ja millised katsumused seisavad statistikaametite kui riikliku statistika tootjate ees?

Kõige rohkem on andmete ökosüsteemi muutnud viimaste aastate andmerevolutsioon. Kaks peamist tegurit on järjest suurem info digimine ja mõiste „suurandmed“ kasutuselevõtt. Andmerevolutsiooni tulemusena on muutunud ka huvirühmade ootused: soovitakse järjest enam avaandmeid, mida saaks kiiremini kätte veebiportaalide, API-de (ingl application programming interface) ehk liideste ja jagamisplatvormide kaudu. Seetõttu on statistikat hakanud tootma ka teised organisatsioonid, kes kasutavad ära uusi andmeallikaid, tööriistu ja meetodeid.

Nõudlust andmetele ligipääsu järele kihutavad tagant kiired tehnoloogilised muutused, sh tehisintellekt ja masinõpe. Oma osa on ka andmeanalüütikute ja andmeteadlaste paremal andmekirjaoskusel. Riikliku statistika tootjatena peaksime sellega arvestama ja viima oma tegevuse järgmisele tasandile.

Statistikaamet on Eestis peamine andmete kogumise ja haldamisega tegelev asutus. Milles seisneb väärtus, mida teie asutus pakub valitsusele, meediale ja erasektorile?

Hiljuti täiendatud „Eesti infoühiskonna arengukavast 2020“ tulenevad ka Eesti statistikaameti uued ülesanded. Arengukava keskmes on tarkade info- ja sidetehnoloogialahenduste hästi toimiv ning turvaline kasutamine, mis parandab elukvaliteeti, majanduse tootlikkust ja tõhustab avaliku sektori tegevust. Statistikaametit on nimetatud avaliku sektori andmehalduse ja andmeteaduse kompetentsikeskuseks, mille eesmärk on toetada andmetest lähtuvat otsuste langetamist Eestis.

Uues andmehalduse süsteemis osaleb meie asutus tõhusas levitamistöös, avaandmete ja andmete elutsükli haldamises. Eelkõige pühendume aktiivsele andmehaldusele valitsussektoris. Sellega kaasneb mitu väärtust loovat põhiülesannet:

  • tagada kvaliteet ja toetada andmete parimat kasutust;
  • hõlbustada andmetele ligipääsu;
  • edendada eksperditeadmisi, oskusi ja andmekirjaoskust;
  • kasutada ühiseid standardeid ja edendada andmepoliitikat;
  • töötada välja andmestrateegia, sh käsitletakse ka andmejagamist ja koostöö tegemist.

Kõnealused ülesanded on väga olulised, nende väärtus ei seisne üksnes parema info jagamises teadmispõhiste otsuste langetamiseks. Tagada tuleb ka tõhus andmekasutus erinevates valdkondades. Sellest tulenevalt on äärmiselt tähtis metaandmete nõuetekohane haldus ja andmete kvaliteet.

Andmehaldus ja andmed riigivalitsemises. Missuguseid põhimõtteid järgivad statistikaametid uues rollis ning kuidas võib see mõjutada poliitikat ja otsuste langetamist ühiskonnas?

Tänu statistikaametitele saab andmetest info, millel on tähendus. Pikaaegne andmete haldamise kogemus on statistikaametitele andnud oskuse toota kvaliteetseid andmeid poliitika tegemiseks ja otsuste langetamiseks. Tuleb siiski silmas pidada, et andmete kasutamise märkimisväärse kasvu tõttu ei ole see protsess enesestmõistetav.

Andmete haldamiseks on vaja nii andmehõive ja andmekaitse kui ka analüüsi- ja visualiseerimisoskusi. Oleme veendunud, et peagi loob iga asutus andmehalduri ametikoha, sest on vaja määratleda, mida andmed süsteemides tähendavad ja kuidas teised vajalikule infole ligi pääsevad. Andmete turvaline hoiustamine ja samal ajal nende kasutamine õiguspäraste otsuste langetamiseks või e-teenuste osutamiseks on väärt miljoneid.

Kas mõistet „suurandmed“ kasutatakse vähem? Kas on neid, kes pooldavad selle asemel „tarkade andmete“ haldamist? Aga mis oleks selle eelised?

Nagu on ilmnenud analüüsitud projektidest, ei seisne väärtus ilmtingimata selles, et tegemist on „suurandmetega“. Tavaliselt kirjeldatakse „suurandmeid“ kolme näitaja (3V) kaudu: maht, mitmekesisus ja kiirus (ingl volume, variety, velocity). Vahel lisatakse veel kaks näitajat: õigsus ja väärtus (ingl veracity, value). Väärtus seisneb andmete loomingulises kasutamises, nt erinevate (suurte ja väikeste) andmeallikate uuel viisil sobitamises, samuti ebatavaliste allikate kasutamises ning uute meetodite ja algoritmide loomises.

Väärtus tuleneb ka tavapärasemate statistiliste meetodite ja andmeteaduse uute tehniliste võimaluste kokkusobitamisest, mitte nende üksteisele vastandamisest. Sellest vaatenurgast lähtudes ühendavad „targad andmed“ mõlemat liiki teadmisi, olles samal ajal nende teadmiste ülene, viies kokku statistikud ja andmeteadlased.

Koos andmeallikate hulga suurenemisega areneb ka infotöötluse võimekus. Milline on andmeanalüüsi ja andmelevi tulevik?

Andmerevolutsioon võimaldab andmeid analüüsida õigeaegsemalt ja detailsemalt. Nii saab täpsemat infot sotsiaal-majandusliku ja säästva arengu näitajate kohta.

Mida rohkem on andmeid ja infot, seda tähtsam on leida õigeaegseim, usaldusväärseim ja läbipaistvaim teave. Seetõttu ei räägi me tulevikus niivõrd sellest, kust või millist infot on võimalik leida, kuivõrd sellest, millised on kõige olulisemad heaolu ja säästva arengu näitajad.

Intervjuu autor on Federico Plantera. Intervjuu on ilmunud e-Estonia 2019. aasta juuli uudiskirjas.