Perchè l'anonimizazione classica (è pseudonimizazione) ùn deriva micca in dati anonimi

Chì hè l'anonimizazione classica?

Cù anonimizazione classica, implicemu tutte e metodulugie induve si manipula o distorsiona un dataset originale per impedisce a traccia di l'individui.

Esempii tipichi di anonimizazione classica chì vemu in pratica sò generalizazione, suppressione / asciugatura, pseudonimizazione è rimessa in fila è colonna.

Eccu quelle tecniche cun esempi currispondenti.

Tecniche Dati uriginali Dati manipulati
Generalizazione Anni di 27 Trà 25 è 30 anni
Soppressione / asciugà info@syntho.ai xxxx@xxxxxx.xx
Pseudonimizazione Amsterdam hVFD6td3jdHHj78ghdgrewui6
Fila è colonna chì si mischjanu Alliniatu Imbulighjatu

Chì sò i svantaghji di l'anonimizazione classica?

Manipulà un set di dati cù tecniche classiche di anonimizazione si traduce in 2 svantaghji chjave:

  1. A distorsione di un set di dati risulta in una diminuzione di a qualità di i dati (vale à dì l'utilità di i dati). Questu introduce u classicu principiu di garbage-in garbage-out.
  2. Risicu di privacy serà ridutta, ma serà sempre presente. Stà è versione manipulata di u dataset originale cù relazioni 1-1.

Dimustremu quelli 2 svantaghji principali, utilità di dati è prutezzione di privacy. Facemu ciò cù l'illustrazione seguente cù suppressione applicata è generalizazione.

Nota: adupremu immagini per scopi illustrativi. U listessu principiu vale per i dati strutturati.

L'anonimizazione classica fiasca
  • Sinistra: poca applicazione di l'anonimizazione classica risulta in una illustrazione rappresentativa. Tuttavia, l'individuu pò esse facilmente identificatu è u risicu di riservatezza hè significativu.

 

  • Diritta: l'applicazione severa di l'anonimizazione classica risultati in una forte prutezzione di privacy. Tuttavia, l'illustrazione diventa inutile.

E tecniche classiche di anonimizazione offrenu una cumbinazione subottima trà utilità di dati è prutezzione di privacy.

Questu introduce u scambiu trà l'utilità di i dati è a prutezzione di a privacy, induve e tecniche classiche di anonimizazione offrenu sempre una cumbinazione subottima di tramindui. 

curva di utilità di l'anonimizazione classica

Eliminà tutti l'identificatori diretti (cum'è i nomi) da u dataset hè una soluzione?

Innò Questa hè una grande idea sbagliata è ùn dà micca risultati anonimi. L'applicate sempre cusì per anonimizà u vostru dataset? Allora stu blog hè un must read per voi.

Cumu hè diffirenti i Dati Sintetichi?

Syntho sviluppa un software per generà un inseme di dati completamente novu di novi registri di dati. L'infurmazione per identificà l'individui veri ùn hè simplicemente micca presente in un set di dati sintetichi. Siccomu i dati sintetichi cuntenenu registrazioni di dati artificiali generati da u software, i dati persunali ùn sò simplicemente prisenti, resultendu in una situazione senza rischi per a privacy.

A differenza chjave in Syntho: applicemu l'apprendimentu machine. Di conseguenza, a nostra soluzione riproduce a struttura è e pruprietà di u set di dati originali in u set di dati sinteticu chì dà un utilità massimu di dati. Di conseguenza, puderete uttene i stessi risultati quandu analizate i dati sintetichi paragunatu à l'usu di i dati originali.

Stu studiu di casu dimostra i punti culminanti di u nostru rapportu di qualità chì cuntene diverse statistiche da dati sintetichi generati attraversu u nostru Syntho Engine in paragunà cù i dati originali.

In conclusione, i dati sintetici sò a soluzione preferita per superà u tipicu scambiu subottimali trà l'utilità di dati è a prutezzione di a privacy, chì tutte e tecniche classiche di anonimizazione vi offre.

curva di utilità di l'anonimizazione classica

Allora, perchè aduprà dati veri (sensibili) quandu pudete aduprà dati sintetici?

In conclusione, da una perspettiva di utilità di dati è di prutezzione di a privacy, unu deve sempre optà per i dati sintetichi quandu u vostru casu d'utilizazione permette cusì.

 Valore per l'analisiRisicu di privacy
Dati sinteticiHighNone
Dati veri (persunali)HighHigh
Dati manipulati (per mezu di 'anonimizazione' classica)Bassu-MediumMediu-Alto
idea

I dati sintetici di Syntho riempenu e lacune induve e tecniche classiche di anonimizazione falanu cortu maximizendu tramindui data-utilità e prutezzione di a privacy.

Interessatu?

Esplora u valore aghjuntu di Dati Sintetichi cun noi