Statistikaameti andmekool #2: Täpne rahvaarv selgub pea 70 miljoni andmerea analüüsimisel

Blogi
Postitatud 19. jaanuar 2024, 13.44 , juhtivanalüütik Terje Trasberg, juhtivanalüütik Kristjan Erik Loik

Statistikaamet teatas 18. jaanuaril, et esialgsetel andmetel elas 2024. aasta alguse seisuga Eestis 1 366 491 inimest. Uudise lõpetas lause, et täpsustatud rahvaarv selgub mai keskel. Mille peale kulub vahepealne aeg ja miks ei saa digiajastul loetud päevadega arvutada niivõrd elementaarset näitajat nagu riigi rahvaarv, kirjutavad statistikaameti juhtivanalüütikud Terje Trasberg ja Kristjan Erik Loik.

Kuidas kogutakse Eesti elu puudutavaid andmed ja mida nendega tehakse? Kuidas saab rahvaloendusel kõik Eesti inimesed üles lugeda, kui minu ukse taga ei käinud keegi? Kuidas minu elu sellest paremaks muutub, kui SKP-d arvutatakse? Statistikaameti blogisari „Andmekool“ tutvustab ameti tööd ja statistika tegemist lähemalt!

Muidugi mõista on Eestis kasutusel rahvastikuregister, kuhu kantakse sisse nii elanike sünnid kui ka surmad. Niisamuti on seal olemas info elukohariigi kohta ning elanik saab registrile teatada oma Eestist lahkumisest (väljarändest) ja Eestisse saabumisest (sisserändest). Sellise meetodiga, kus eelmise aasta rahvaarvust arvatakse maha aasta jooksul surnud ja siit lahkunud inimesed ning liidetakse juurde sündinud ja Eestisse elama asunud, saabki kokku jaanuaris avaldatud esialgse rahvaarvu.

Esialgse rahvaarvu arvutamine

Enne, kui statistika tegemiseks võeti kasutusele registrid, piirduski rahvaarvu arvutamine sellega. Siis olid kord kümnendi jooksul toimuvad rahvaloendused tõe kriteeriumiks ja baasiks, mille alusel sünde, surmi ja rännet vastavalt lahutati ja liideti.

Murekoht tekib siis, kui üks või mitu sündmust jäävad registreerimata. Tänapäeval on sünnid ja surmad hästi teada ja nendega muret ei ole. See-eest riigist lahkuda ja siia sisse rännata on Euroopa Liidus küllaltki lihtne, sest piirid on lahti ning elamis- ja töötamisluba pole vaja. Eesti kodanikud jätavad sageli oma lahkumise, aga ka siia naasmise riigile teatamata, mistõttu tekivad ebakõlad registrijärgse ja püsielanikkonna vahel. Seetõttu avaldab statistikaamet juba kaheksandat korda rahvaarvu residentsuse indeksi alusel.

Rännak mööda registreid

Residentsuse indeksi idee seisneb selles, et igale potentsiaalsele Eesti elanikule – mõnes Eestiga seotud registris esinevale inimesele – arvutatakse indeks väärtusega 0 ja 1 vahel. Indeks hindab, kui suure tõenäosusega on tegu Eesti püsielanikuga. Väärtus 1 tähendab, et inimene on kindel püsielanik ja väärtus 0 tähistab kindlat mittepüsielanikku. Arvutusi saab teha tänu 18 registrile* ja neis leiduvale 33 tunnusele, milles kajastub erinevat infot Eesti elanike kohta. Eestis elades, siin töötades, õppides või muid asju ajades jäävad inimestest maha registrikanded, mis võetakse kasutusele kui võimalikud „elumärgid“. Kogutud elumärkide summast ja iga elumärgi erikaalust sõltubki residentsuse indeksi väärtus. Kaale on vaja, sest näiteks hambaravihüvitise kasutamine või dokumendi taotlemine on võrdlemisi lihtsalt kogutavad elumärgid, mille võib saada ka inimene, kes tegelikult elab näiteks Soomes. See-eest Eestis õppimine või ajateenistuses viibimine on tugevama kaaluga elumärgid ning nende kogumine on mittepüsielanikul juba keerulisem.

Viimastel aastatel on residentsuse indeks arvutatud ligi 1,9 miljonile inimesele ja Eesti püsielanikeks loeti neist 2023. aastal 1,37 miljonit inimest. Ülejäänud kogusid elumärke kas liiga vähe või üldse mitte ning neid ei loeta püsielanike hulka kuuluvaks. Indeks arvutatakse kord aastas ja see on ka seotud püsielaniku definitsiooniga, mille järgi on püsielanik see, kes elab või kavatseb elada Eestis 12 kuud.

Residentide kogutud elumärkide arv

Kõige sagedamini kogub Eesti püsielanik aastaga kuus elumärki

Miks alles maiks?

Eesti rahvaarv selgub, kui kõik 18 registrit, nendega ühes 33 tunnust ja sellega kaasnevad ligi 70 miljonit andmerida on kohale jõudnud ja läbi analüüsitud. Paraku võtab paljude erinevate allikate kasutamine oma aja. Kaugeltki mitte kõik registrid ei uuene aastavahetuseks, vaid tarvis on andmekontrolle ja parandusi. Residentsuse indeksi kasutamine ja aasta alguses esialgse rahvaarvu avaldamine on kompromiss täpsuse ja kiiruse vahel.

Võib ka küsida, milleks üldse asju keeruliseks ajada ja esialgset rahvaarvu avaldada. Vastus on lihtne – seda ootavad rahvusvahelised organisatsioonid (nt IMF), kes esialgse rahvaarvu põhjal erinevaid prognoose koostavad ja selle järele küsivad Eesti tarbija ja meedia juba aasta alguses. Esialgse rahvaarvu täpsus on iga inimese enda teha: hoides oma andmed rahvastikuregistris ajakohased väheneb registreerimata rände osakaal Eesti rahvastikust ning seeläbi ka erinevus esialgse ja täpsustatud rahvaarvu vahel.

Milleks seda kõike kasutatakse?

Statistikaameti eesmärk on toota statistikat elanikkonna kohta. See kehtib ka residentsuse indeksi kohta, s.t indeksi tulemit kasutatakse ainult statistika tegemise eesmärgil ning see ei mõjuta infot, mille inimesed ise enda kohta registritesse kirja pannud on. Näiteks peatselt toimuvate Euroopa Parlamendi valimiste valimisnimekirjad koostatakse selle põhjal, millisesse riiki on inimene end rahvastikuregistri järgi registreerinud, isegi kui reaalsuses elatakse mujal. Registripõhise statistika eesmärk on võimalikult palju taaskasutada juba olemasolevaid andmeid, et riik ei peaks samu asju inimestelt mitu korda küsima.

Indeksiga arvutatud rahvaarv on vajalik, et me teaksime, kui palju Eestisse ja Eestist rännatakse ning omaksime ülevaadet päriselt kohal olevast rahvastikust. Selle järgi tehakse otsuseid nii väikestes kogukondades kui ka riiklikes arengukavades, mis võivad meie elu aastakümneid mõjutada.

* - Residentsuse indeksi leidmiseks kasutatakse infot järgmistest registritest (sulgudes on välja toodud elumärkide arv, mida konkreetse registri põhjal arvutatakse): Eesti Hariduse Infosüsteem (3 märki), rahvastikuregister (3), e-toimik (1), isikut tõendavate dokumentide andmekogu (1), kaitseväekohustuslaste register (1), liiklusregister (2), maksukohustuslaste register (1), tervisekassa andmekogu (5), retseptikeskus (1), riigi personali- ja palgaarvestuse andmekogu (1), riiklik elamis- ja töölubade register (1), sotsiaalkaitse infosüsteem (6), sotsiaalteenuste ja -toetuste andmeregister (1), töötamise register (1), töötuna ja tööotsijana arvel olevate isikute ning tööturuteenuste osutamise register (1), töövõime hindamise ja töövõimetoetuse andmekogu (1), vangide ja kriminaalhooldusaluste register (2) ning Euroopa sotsiaalfond (1).

 

Loe metoodika kohta lähemalt siit:

Residentsuse indeksi rakendamine rahvastikustatistikas

2021. aasta registripõhise loenduse metoodika kirjeldus (residentsuse indeksis kasutatud registrite ja elumärkide nimekirja leiad leheküljelt 7 tabelist nr 1)

Head kliendid! Hooldustööde tõttu toimub 26. veebruaril ajavahemikus 14.00–18.00 statistikaameti  veebilehtedel  katkestus. Vabandage!