Mis on riiklik statistika ja kuidas seda tehakse?

Riiklik statistika on avalik teave. Statistikat tehakse ühiskonna huvides riikliku või Euroopa Liidu statistikaprogrammi alusel. Riiklik statistika on kõigile kättesaadav ja selle abil on igaühel võimalik teha elus või äris vajalikke otsuseid. Riiklik statistika on kooskõlas rahvusvaheliste klassifikaatorite ja meetoditega ning kooskõlas erapooletuse, usaldusväärsuse, asjakohasuse, tasuvuse, konfidentsiaalsuse ja läbipaistvuse põhimõttega. Eestis teevad riiklikku statistikat statistikaamet ja Eesti Pank.

 

Statistikaamet ühes aastas:

  1. Üle 150 statistikatöö
  2. 90 000 andmeesitajat
  3. 420 000 kogutud aruannet
  4. 65 000 korda vastab klienditugi kõnedele ja kirjade
  5. 132 000 aruannetega kogutud muutujat
  6. 1,3 miljonit veebikülastust
  7. Ligi 2 miljonit andmebaasi vaatamist
  8. Üle 3500 statistikapäringu
 

 

 
  • 1. Vajaduse täpsustamine

    Inimene on alati olnud uudishimulik, see on tema mõistuse arengu ja mõistuspärase käitumise alus. Suur hulk küsimusi algab sõnadega „kui palju“. Tänapäeval esitatakse selliseid küsimusi sageli statistikaametile.

     

    • Kui palju on maakonnas N lapsi, kes järgmisel aastal kooli lähevad?
    • Kui palju on leibkondi, kus koos elavad partnerid ei ole ametlikult abielus?
    • Kui palju teenivad inimesed keskmiselt kuus Valgamaal, Ida-Virumaal või kogu Eestis?


    Küsimustele, mille vastu on suur avalik huvi, leiab sageli vastused statistikaameti veebilehelt statistika andmebaasist. Statistikaamet kogub tarbijatelt regulaarselt tagasisidet, mis infot ühiskonnas vajatakse. Statistika suurimad tarbijad on riigiasutused, tegevusalaliidud, teadus- ja haridusasutused ning omavalitsusliidud.

    2. Tootmissüsteemi disain

    Tänapäeval on huvipakkuv info tihti osaliselt või täielikult kogutud mõnda riiklikku andmekogusse. Statistika tegemisel kasutatakse võimalikult palju juba olemasolevat teavet, sealhulgas ka riiklike andmekogude, näiteks rahvastikuregistri, äriregistri, Eesti hariduse infosüsteemi, ehitisregistri infot.


    Järjest enam pakub statistika tegemisel huvi automaatprotsesside käigus tekkiv info, näiteks mobiilpositsioneerimise andmete teave, sotsiaalvõrgustiku info, satelliitpiltide kasutamine.
    Kui uuritavate tunnuste seas on hinnangud (näiteks rahulolu) või info, mida ei ole võimalik saada ühestki andmebaasist, on vaja inimesi või majandusüksusi küsitleda. Küsimustiku koostamine on uuringu ettevalmistamise töömahukamaid etappe.

    3. Tootmissüsteemi teostus

    Isikute küsitlemise meetodid on aja jooksul täienenud, kuid siiani ei ole kõrvale jäetud ka klassikalist silmast silma intervjuud, mis aga on ajamahukas ja kallis. Järjest enam kasutatakse andmete kogumiseks telefoniintervjuud ja veebiküsitlust. Enamasti annab parima tulemuse mitme meetodi kombineerimine.


    Enamik majandusüksuste uuringutest tehakse veebiküsitlusena, mis on vastajale kõige mugavam ja ajapaindlik.

    4. Andmete kogumine

    Uurimisülesande püstitamisel määratakse täpselt üldkogum ehk isikute või objektide hulk, mille või kelle kohta soovitakse järeldusi teha. Valikuuringu korral valitakse nende hulgast välja osa ehk tehakse valim ja määratakse selle maht. Nii esindab iga valimisse sattunud isik või majandusüksus tervet hulka sarnaseid isikuid või majandusüksusi.

    Andmete kogumine on kõige kallim ja aeganõudvam etapp. Kui see ebaõnnestub, sest uuringus osalejad ei vasta või on nende vastused ebaloogilised, ei selgu uuringust midagi, sest usaldusväärsete andmeteta ei saa ka usaldusväärseid tulemusi.

    5. Andmete töötlemine

    Andmete ettevalmistamine analüüsiks on oluliselt kiirenenud tehnika arengu ja andmekogumise programmidesse lisatud kontrollide tõttu, mis ei luba anda loogiliselt vastuolulisi vastuseid (näiteks ei saa 17-aastane vastaja olla kõrgharidusega). Ka andmeid kodeeritakse enamasti elektroonselt.

    Siiski pole elektroonselt kogutud andmed alati päris korrektsed. Andmetega tegelenud iga inimene teab, et trükikurat on leidlik ka andmestikes. Salavigu avastatakse keeruliste kontrollide rakendamisel ja teiste allikatega võrdlemisel. Andmestikes on suur probleem andmelünk või tühik, mis segab andmetöötlust eriti siis, kui soovitakse rakendada keerukamaid mudeleid. Puuduvate väärtuste asendamiseks kasutatakse mitmesuguseid imputeerimise meetodeid, mille käigus mõni objekti väärtus asendatakse väärtusega, mis on võimalikult sarnaste objektide samal tunnusel.

    Et valimi andmeid saaks kasutada üldkogumi kohta, tuleb igale valimi objektile arvutada kaal ehk laiendustegur. Valimiobjekti kaal näitab, mitut sarnast üldkogumi objekti see valimiobjekt esindab. Valimiobjekti kaal on alati üks või ühest suurem arv. Majandusüksuse uuringutes on suurte üksuste kaal sageli üks, sest need on Eesti tingimustes piisavalt eripärased ja neile sarnaseid üksusi üldkogumis ei leidu.

    6. Statistika arvutamine ja analüüs

    Andmekogumise käigus saadud info tuleb teisendada selliseks, et saaks vastata uuringu alguses esitatud küsimustele. Üsna sageli arvutatakse kogutud andmete alusel keskväärtusi (keskmine brutokuupalk) või kogusummasid (töötute koguarv), aga ka mitmesuguseid indekseid. Hinnaindeksid näitavad hindade muutumist ajas. Kõige mahukam, kus pannakse kokku eri valdkondade statistika, on aga sisemajanduse koguprodukti arvutus.

    Statistika avaldamisel peab statistikaamet tagama, et andmetabelites esitatud info ei võimaldaks ühtegi majandusüksust, isikut või muud objekti tuvastada. Selleks rakendatakse erinevaid matemaatilisi meetodeid.
    Suur osa uuringutulemustest esitatakse jaotuste ja tabelitena, kuid mõnikord analüüsitakse edasi ja rakendatakse keerukamaid statistikameetodeid. Üha enam kasutatakse statistikatöödes mudeleid. Need aitavad leida seoseid ja põhjusi. Näiteks võib küsida, mis mõjutab sissetuleku suurust. Keerukaid mudeleid kasutatakse aegridade analüüsimiseks.

    7. Tulemuste avaldamine ja statistika levitamine

    Analüüsimisel on mõtet üksnes siis, kui analüüsitulemused jõuavad tarbijani. Tänapäeval on esikohal elektrooniline levi. Elektroonsete tabelite ja jooniste eelis on interaktiivsus: tarbija saab ise tabeleid valida ja ka diagramme kujundada oma huvi ja vajaduste alusel.
    Senise ruumistatistika väga oluline täiendus on paljukihilised interaktiivsed kaardid.
    Trükitekstide hulk on märgatavalt vähenenud, kuid siiski pole paberraamatud ja -ajakirjad kadunud, pigem on need muutunud sisukamaks ja kompaktsemaks.

    8. Andmete hindamine

    Avaldatud statistika kvaliteedi hindamisel lähtutakse viiest põhimõttest: asjakohasus, täpsus ja usaldusväärsus, ajakohasus ja õigeaegsus, sidusus ja võrreldavus, kättesaadavus ja selgus.
    Täpsuse ja usaldusväärsuse mõõtmiseks on palju kvaliteedinäitajaid, neist olulisemad on standardviga ja variatsioonikordaja. Valimi alusel arvutatud kogusummad ja keskväärtused on hinnangulised tegelikud kogusummad ja keskväärtused, mida me üldjuhul ei tea, kui me just ei küsitle kõiki üldkogumisse kuuluvaid objekte. Hinnangu lähedust tegelikule suurusele näitab standardviga või variatsioonikordaja. Mida väiksemad need on, seda täpsem on arvutatud hinnang. Statistika kvaliteedinäitajad on veel vastamismäär, imputeerimismäär, ala- ja ülekaetusest tingitud nihe.

Head kliendid! Seoses hooldustöödega on kuni 15 minutiline katkestus Statistikaameti veebilehel kolmapäeval, 23.09.2020 kell 18:30 - 18:45. Vabandame võimalike ebamugavuste pärast.