Zergatik anonimizazio klasikoak (eta pseudonimizazioak) ez du datu anonimorik sortzen

Zer da anonimizazio klasikoa?

Anonimizazio klasikoarekin, jatorrizko datu-multzo bat manipulatu edo desitxuratzen den metodologia guztiak inplikatzen ditugu, gizabanakoen jarraipena eragozteko.

Praktikan ikusten ditugun anonimizazio klasikoen adibide tipikoak orokortzea, kentzea / ezabatzea, sasi-izenak eta lerro eta zutabeen nahastea dira.

Honen bidez dagozkien adibideak dituzten teknika horiek.

Teknika Jatorrizko datuak Manipulatutako datuak
orokortzea 27 urte zituela 25 eta 30 urte bitartean
Ezabatzea / ezabatzea info@syntho.ai xxxx@xxxxxx.xx
Pseudonimizazioa Amsterdam hVFD6td3jdHHj78ghdgrewui6
Ilara eta zutabe nahasketa Lerrokatuta Nahastuta

Zein dira anonimizazio klasikoaren desabantailak?

Anonimizazio teknika klasikoekin datu multzo bat manipulatzeak 2 gako desabantaila eragiten ditu:

  1. Datu multzo bat distortsionatzeak datuen kalitatea murrizten du (hau da, datuen erabilgarritasuna). Honek zabor-sartu zabor-printzipio klasikoa aurkezten du.
  2. Pribatutasun arriskua murriztuko da, baina beti egongo da presente. 1-1 erlazioekin jatorrizko datu-basearen bertsioa mantendu eta manipulatzen du.

Bi funtsezko desabantaila horiek, datuen erabilgarritasuna eta pribatutasun babesa erakusten ditugu. Hurrengo ilustrazioarekin egiten dugu ezabatutako aplikazioarekin eta orokortzearekin.

Oharra: irudiak helburu ilustratiboetarako erabiltzen ditugu. Datu multzo egituratuetan printzipio bera gertatzen da.

Anonimizazio klasikoak huts egiten du
  • Ezker: anonimizazio klasikoaren aplikazio txikiak ilustrazio adierazgarri batean ematen du. Hala ere, gizabanakoa erraz identifika daiteke eta pribatutasun arriskua nabarmena da.

 

  • Eskuin: anonimizazio klasikoaren aplikazio zorrotzak pribatutasun babes sendoa lortzen du. Hala ere, ilustrazioak ez du ezertarako balio.

Anonimizazio teknika klasikoek datuen erabilgarritasunaren eta pribatutasunaren babesaren arteko konbinazio optimoa eskaintzen dute.

Horrek datuen erabilgarritasunaren eta pribatutasunaren babesaren arteko trukea aurkezten du, non anonimizazio teknika klasikoek beti konbinazio optimoa eskaintzen duten. 

Anonimizazioaren erabilgarritasun kurba klasikoa

Identifikatzaile zuzen guztiak (esate baterako, izenak) datu-basetik kentzea irtenbide bat al da?

Ez. Uste okerra da eta ez du datu anonimorik sortzen. Oraindik aplikatzen al duzu zure datu-multzoa anonimizatzeko modu gisa? Ondoren blog hau zuretzat irakurri beharrekoa da.

Zertan bereizten dira Datu Sintetikoak?

Synthok softwarea garatzen du datu berrien erregistroen datu multzo berri bat sortzeko. Benetako pertsonak identifikatzeko informazioa ez dago datu sintetiko batean. Datu sintetikoek softwareak sortutako datu artifizialen erregistroak dituztenez, datu pertsonalak ez daude presente pribatutasun arriskurik ez duen egoera batean.

Synthoren funtsezko desberdintasuna: ikaskuntza automatikoa aplikatzen dugu. Ondorioz, gure soluzioak jatorrizko datu-multzoaren egitura eta propietateak erreproduzitzen ditu datu-base sintetikoan datuen erabilgarritasuna maximizatuta. Horrenbestez, emaitza berdinak eskuratu ahal izango dituzu jatorrizko datuak erabiltzearen aldean datu sintetikoak aztertzerakoan.

Kasu hau jatorrizko datuekin alderatuta gure Syntho Engine-aren bidez sortutako datu sintetikoen estatistika desberdinak biltzen dituen kalitate txosteneko datu aipagarriak erakusten ditu.

Bukatzeko, datu sintetikoak dira anonimizazio teknika klasiko guztiek eskaintzen dizuten datuen erabilgarritasunaren eta pribatutasunaren babesaren arteko truke optimorik gabeko azpimarragarria gainditzeko irtenbide hobetsia.

Anonimizazioaren erabilgarritasun kurba klasikoa

Orduan, zergatik erabili benetako datuak (sentikorrak) datu sintetikoak erabil ditzakezunean?

Bukatzeko, datuen erabilgarritasuna eta pribatutasuna babesteko ikuspegitik, beti erabili behar da datu sintetikoak zure erabilera kasuak hala uzten duenean.

 Analisirako balioaPribatutasun arriskua
Datu sintetikoakHighBat ere ez
Benetako datuak (pertsonalak)HighHigh
Manipulatutako datuak ('anonimizazio' klasikoaren bidez)Behe-ErtainaErdi-Goi
ideia

Synthoren datu sintetikoek anonimizazio teknika klasikoak motz geratzen diren hutsuneak betetzen dituzte biak maximizatuz datu-erabilgarritasuna   pribatutasun-babesa.

Interesa?

Arakatu Datu Sintetikoen balio erantsia gurekin