Miks klassikalise anonüümseks muutmise (ja pseudonüümimise) tulemuseks ei ole anonüümsed andmed

See blogi hõlmab järgmisi teemasid:

Mis on klassikaline anonüümsus?
Millised on klassikalise anonüümsuse puudused?
Miks pakuvad klassikalised anonüümseks muutmise meetodid ebaoptimaalset kombinatsiooni andmete kasulikkuse ja privaatsuse kaitse vahel ?.
Mille poolest erinevad sünteetilised andmed?
Miks ikkagi kasutada isikuandmeid, kui saate kasutada sünteetilisi andmeid?

Mis on klassikaline anonüümsus?

Klassikalise anonüümseks muutmise korral kasutame kõiki metoodikaid, mille puhul manipuleeritakse või moonutatakse esialgset andmekogumit, et takistada üksikisikute jälgimist.

Klassikalise anonüümimise tüüpilised näited, mida me praktikas näeme, on üldistamine, summutamine / pühkimine, pseudonüümimine ning ridade ja veergude segamine.

Siinkohal need tehnikad koos vastavate näidetega.

Tehnika	Algandmed	Manipuleeritud andmed
Üldistamine	27 aastat vana	Vanuses 25–30 aastat
Supressioon / pühkimine	info@syntho.ai	xxxx@xxxxxx.xx
Pseudonüümimine	Amsterdam	hVFD6td3jdHHj78ghdgrewui6
Rea ja veeru segamine	Joondatud	Segatud

Millised on klassikalise anonüümsuse puudused?

Andmekogumi manipuleerimine klassikaliste anonüümimismeetoditega toob kaasa kaks peamist puudust:

Andmekogumi moonutamine toob kaasa andmete kvaliteedi halvenemise (st andmete kasulikkuse). See tutvustab klassikalist prügi sisse prügi väljaviimise põhimõtet.
Privaatsusrisk väheneb, kuid on alati kohal. See jääb ja manipuleerib algse andmestiku versiooniga 1-1 seosega.

Näitame neid kahte peamist puudust, andmete kasulikkust ja privaatsuse kaitset. Teeme seda järgmise illustratsiooniga koos rakendatud summutamise ja üldistamisega.

Märkus: me kasutame pilte illustratiivsetel eesmärkidel. Sama põhimõte kehtib ka struktureeritud andmekogumite kohta.

Vasak: klassikalise anonüümsuse vähese rakendamise tulemuseks on esinduslik illustratsioon. Siiski on üksikisikut lihtne tuvastada ja privaatsusrisk on märkimisväärne.

Õigus: klassikalise anonüümseks muutmise tõsine rakendamine tagab tugeva privaatsuse kaitse. Illustratsioon muutub aga kasutuks.

Klassikalised anonüümimise meetodid pakuvad ebaoptimaalset kombinatsiooni andmete kasulikkuse ja privaatsuse kaitse vahel.

See tutvustab kompromissi andmete utiliidi ja privaatsuse kaitse vahel, kus klassikalised anonüümseks muutmise meetodid pakuvad alati mõlema optimaalset kombinatsiooni.

Kas kõigi otseste identifikaatorite (nt nimede) eemaldamine andmestikust on lahendus?

Ei. See on suur eksiarvamus ega too kaasa anonüümseid andmeid. Kas rakendate seda endiselt andmekogumi anonüümseks muutmiseks? Siis on see blogi teie jaoks kohustuslik lugemine.

Mille poolest erinevad sünteetilised andmed?

Syntho arendab tarkvara värskete andmekirjete täiesti uue andmestiku loomiseks. Teavet reaalsete isikute tuvastamiseks sünteetilises andmekogus lihtsalt pole. Kuna sünteetilised andmed sisaldavad tarkvara genereeritud tehisandmete kirjeid, ei ole isikuandmeid lihtsalt olemas, mille tulemuseks on olukord, kus puudub privaatsusrisk.

Peamine erinevus Syntho's: rakendame masinõpet. Sellest tulenevalt taasesitab meie lahendus sünteetilise andmekogumi algse andmestiku struktuuri ja omadusi, mille tulemuseks on maksimeeritud andmete kasulikkus. Seega saate sünteetiliste andmete analüüsimisel saada samu tulemusi kui esialgsete andmete kasutamisel.

See juhtumiuuring näitab meie kvaliteediaruande esiletõstmist, mis sisaldab erinevat statistikat meie Syntho Engine'i kaudu loodud sünteetilistest andmetest võrreldes algandmetega.

Kokkuvõtteks võib öelda, et sünteetilised andmed on eelistatud lahendus, et ületada tüüpiline ebaoptimaalne kompromiss andmete kasulikkuse ja privaatsuse kaitse vahel, mida pakuvad teile kõik klassikalised anonüümimise meetodid.

Miks kasutada tõelisi (tundlikke) andmeid, kui saate kasutada sünteetilisi andmeid?

Kokkuvõtteks võib öelda, et andmete utiliidi ja privaatsuse kaitse seisukohast tuleks alati valida sünteetilised andmed, kui teie kasutusjuhtum seda võimaldab.

	Analüüsi väärtus	Privaatsusrisk
Sünteetilised andmed	Suur	mitte ükski
Tegelikud (isiklikud) andmed	Suur	Suur
Manipuleeritud andmed (klassikalise anonüümseks muutmise kaudu)	Madal-keskmine	Keskmisel kõrgusel

Syntho sünteetilised andmed täidavad lünki, kus klassikalised anonüümimismeetodid jäävad puudu, maksimeerides mõlemat andmete utiliit ja privaatsuse kaitse.

Huvitatud?

Avastage meiega sünteetiliste andmete lisaväärtust

RAAMATDEMO

Mis on sünteetilised andmed?

Kvaliteedi tagamise aruanne

SASi välishindamine

Aegridade sünteetilised andmed

PII skanner

Sünteetilised näidisandmed

Järjepidev kaardistamine

Deidentifitseerimine ja sünteesimine

Reeglipõhised sünteetilised andmed

Alamhulk

Kasutuselevõtt ja integreerimine

Pistikud

Laiendatud funktsioonid

Toetatud andmed

Kasutaja dokumentatsioon

Ajakava demo

hinnapoliitika

Sünteetilised andmed katseandmetena

Sünteetilised andmed analüütika jaoks

Sünteetilised andmed andmete jagamiseks

Sünteetilised andmed toote demo jaoks

Tervishoid

Turundus

Avalikud organisatsioonid

Kasutaja dokumentatsioon

Valged raamatud ja juhendid

Blogi

Webinars

Case Studies