Igaüks loeb!

Andmekaitse põhimõtted

Riiklikku statistikat avaldatakse kujul, mis välistab võimaluse üksikisikut otseselt või kaudselt tuvastada (riikliku statistika seadus, §35 lg 1). Kaudse tuvastamise vältimiseks kasutatakse statistilise aimatavuse kontrolli meetodeid, millega kaitstakse tabelis olevaid väikesi väärtusi andmete muutmise, agregeerimise või müra lisamise abil.
Statistilise aimatavuse kontrolli meetodite eesmärk on tagada tasakaal statistilise väljundi informatiivsuse ja üksikisiku tuvastamise riski vahel.

2011. aasta rahva ja eluruumide loenduse andmete avaldamisel rakendatakse allolevaid põhimõtteid.

  1. Riikliku statistika seaduse § 35 lg 7 järgi ei rakendata aimatavuse kontrolli meetodeid muutujatele „alaline elukoht“, „sugu“ ja „vanus“.
  2. Muude muutujate puhul rakendatakse statistilise kontrolli meetodina juhitud ümardamist juhul, kui elukoht on tabelis esitatud detailsel tasemel (väikesed kohaliku omavalitsuse üksused ja asulad).

Juhitud ümardamise tulemusena muudetakse tegelikke väärtusi üles- või allapoole selliselt, et nende kogusumma oleks võimalikult lähedane tegelikule. Ümardamise tõttu võib alajaotuste summeerimise tulemus erineda avaldatud summast ja sama näitaja väärtused olla eri tabelites pisut erinevad.

Juhitud ümardamise rakendamine

Väärtusi on ümardatud tabelites, mis sisaldavad elukohta kohaliku omavalitsusüksuse tasemel. Neile tabelitele on lisatud märkus ümardamise kohta. Muutujate „elukoht“, „sugu“ ja „vanus“ väärtusi tabelites ei muudeta.

Aimatavuse kontrolli meetodi valikust

Andmekaitse põhimõtteid välja töötades ja konkreetse aimatavuse kontrolli meetodi valikul lähtus Statistikaamet sellest, et oleks tagatud üksikisiku andmete kaitse; et infokadu oleks minimaalne; et oleks võimalik avaldada statistikat ka väikeste omavalitsuste ja asulate kohta ning et kasutatav meetod oleks tarbijatele arusaadav. Kaaluti kahte meetodit: konfidentsiaalsete lahtrite peitmine ja juhitud ümardamine.

Esimese meetodi puhul tuleb peale konfidentsiaalse lahtri väärtuse (1 või 2 isikut) peitmise peita lisaks mittekonfidentsiaalseid lahtreid, et peidetud väärtusi ei saaks tagasi arvutada. Selline meetod on Statistikaametis kasutusel ettevõtete statistika avaldamisel ja on majanduse valdkonnas end hästi õigustanud. Rahvaloenduse korral osutus see aga ebasobivaks, sest väljundtabelid on keerulisema struktuuriga ning lisaks peidetavad lahtrid tekitaksid suure infokao.

Teise meetodi, juhitud ümardamise korral on infokadu minimaalne. Ümardatakse alusel 3, ehk kõik väärtused ümardatakse lähima 3-ga jaguva arvuni. Selliselt on kaitstud väärtused 1 ja 2 ning samal ajal on tekitatud võimalikult vähe infomüra, kuid siiski on võimalik avaldada andmeid ka väikeste omavalitsuste kohta. Avaldatud kõige detailsema taseme väärtused erinevad tegelikest väärtustest 1-2 isiku võrra. Summade korral võib erinevus olla suurem, kuid jääb alla 1%. Ümardades väärtust 0 ei muudeta, väärtused 1 ja 2 on ümardatud 0-ks või 3-ks. Meetodi rakendamiseks kasutatakse spetsiaalset tarkvara tau-Argus.

Aimatavuse kontrolli meetodite rakendamine teistes riikides

Selliseid meetodeid kasutatakse ka teistes arenenud riikides.

Ühendkuningriik
Kanada

Info
E-R kell 8-17
+372 625 9300
stat at stat dot ee
Tatari 51, 10134 Tallinn