Miks klassikalise anonüümseks muutmise (ja pseudonüümimise) tulemuseks ei ole anonüümsed andmed

Mis on klassikaline anonüümsus?

Klassikalise anonüümseks muutmise korral kasutame kõiki metoodikaid, mille puhul manipuleeritakse või moonutatakse esialgset andmekogumit, et takistada üksikisikute jälgimist.

Klassikalise anonüümimise tüüpilised näited, mida me praktikas näeme, on üldistamine, summutamine / pühkimine, pseudonüümimine ning ridade ja veergude segamine.

Siinkohal need tehnikad koos vastavate näidetega.

Tehnika Algandmed Manipuleeritud andmed
Üldistamine 27 aastat vana Vanuses 25–30 aastat
Supressioon / pühkimine info@syntho.ai xxxx@xxxxxx.xx
Pseudonüümimine Amsterdam hVFD6td3jdHHj78ghdgrewui6
Rea ja veeru segamine Joondatud Segatud

Millised on klassikalise anonüümsuse puudused?

Andmekogumi manipuleerimine klassikaliste anonüümimismeetoditega toob kaasa kaks peamist puudust:

  1. Andmekogumi moonutamine toob kaasa andmete kvaliteedi halvenemise (st andmete kasulikkuse). See tutvustab klassikalist prügi sisse prügi väljaviimise põhimõtet.
  2. Privaatsusrisk väheneb, kuid on alati kohal. See jääb ja manipuleerib algse andmestiku versiooniga 1-1 seosega.

Näitame neid kahte peamist puudust, andmete kasulikkust ja privaatsuse kaitset. Teeme seda järgmise illustratsiooniga koos rakendatud summutamise ja üldistamisega.

Märkus: me kasutame pilte illustratiivsetel eesmärkidel. Sama põhimõte kehtib ka struktureeritud andmekogumite kohta.

Klassikaline anonüümseks muutmine ebaõnnestub
  • Vasak: klassikalise anonüümsuse vähese rakendamise tulemuseks on esinduslik illustratsioon. Siiski on üksikisikut lihtne tuvastada ja privaatsusrisk on märkimisväärne.

 

  • Õigus: klassikalise anonüümseks muutmise tõsine rakendamine tagab tugeva privaatsuse kaitse. Illustratsioon muutub aga kasutuks.

Klassikalised anonüümimise meetodid pakuvad ebaoptimaalset kombinatsiooni andmete kasulikkuse ja privaatsuse kaitse vahel.

See tutvustab kompromissi andmete utiliidi ja privaatsuse kaitse vahel, kus klassikalised anonüümseks muutmise meetodid pakuvad alati mõlema optimaalset kombinatsiooni. 

klassikaline anonüümseks muutmise kasulikkuse kõver

Kas kõigi otseste identifikaatorite (nt nimede) eemaldamine andmestikust on lahendus?

Ei. See on suur eksiarvamus ega too kaasa anonüümseid andmeid. Kas rakendate seda endiselt andmekogumi anonüümseks muutmiseks? Siis on see blogi teie jaoks kohustuslik lugemine.

Mille poolest erinevad sünteetilised andmed?

Syntho arendab tarkvara värskete andmekirjete täiesti uue andmestiku loomiseks. Teavet reaalsete isikute tuvastamiseks sünteetilises andmekogus lihtsalt pole. Kuna sünteetilised andmed sisaldavad tarkvara genereeritud tehisandmete kirjeid, ei ole isikuandmeid lihtsalt olemas, mille tulemuseks on olukord, kus puudub privaatsusrisk.

Peamine erinevus Syntho's: rakendame masinõpet. Sellest tulenevalt taasesitab meie lahendus sünteetilise andmekogumi algse andmestiku struktuuri ja omadusi, mille tulemuseks on maksimeeritud andmete kasulikkus. Seega saate sünteetiliste andmete analüüsimisel saada samu tulemusi kui esialgsete andmete kasutamisel.

See juhtumiuuring näitab meie kvaliteediaruande esiletõstmist, mis sisaldab erinevat statistikat meie Syntho Engine'i kaudu loodud sünteetilistest andmetest võrreldes algandmetega.

Kokkuvõtteks võib öelda, et sünteetilised andmed on eelistatud lahendus, et ületada tüüpiline ebaoptimaalne kompromiss andmete kasulikkuse ja privaatsuse kaitse vahel, mida pakuvad teile kõik klassikalised anonüümimise meetodid.

klassikaline anonüümseks muutmise kasulikkuse kõver

Miks kasutada tõelisi (tundlikke) andmeid, kui saate kasutada sünteetilisi andmeid?

Kokkuvõtteks võib öelda, et andmete utiliidi ja privaatsuse kaitse seisukohast tuleks alati valida sünteetilised andmed, kui teie kasutusjuhtum seda võimaldab.

 Analüüsi väärtusPrivaatsusrisk
Sünteetilised andmedSuurmitte ükski
Tegelikud (isiklikud) andmedSuurSuur
Manipuleeritud andmed (klassikalise anonüümseks muutmise kaudu)Madal-keskmineKeskmisel kõrgusel
idee

Syntho sünteetilised andmed täidavad lünki, kus klassikalised anonüümimismeetodid jäävad puudu, maksimeerides mõlemat andmete utiliit ja privaatsuse kaitse.

Huvitatud?

Avastage meiega sünteetiliste andmete lisaväärtust