Klassikalise anonüümseks muutmise korral kasutame kõiki metoodikaid, mille puhul manipuleeritakse või moonutatakse esialgset andmekogumit, et takistada üksikisikute jälgimist.
Klassikalise anonüümimise tüüpilised näited, mida me praktikas näeme, on üldistamine, summutamine / pühkimine, pseudonüümimine ning ridade ja veergude segamine.
Siinkohal need tehnikad koos vastavate näidetega.
Tehnika | Algandmed | Manipuleeritud andmed |
Üldistamine | 27 aastat vana | Vanuses 25–30 aastat |
Supressioon / pühkimine | info@syntho.ai | xxxx@xxxxxx.xx |
Pseudonüümimine | Amsterdam | hVFD6td3jdHHj78ghdgrewui6 |
Rea ja veeru segamine | Joondatud | Segatud |
Andmekogumi manipuleerimine klassikaliste anonüümimismeetoditega toob kaasa kaks peamist puudust:
Näitame neid kahte peamist puudust, andmete kasulikkust ja privaatsuse kaitset. Teeme seda järgmise illustratsiooniga koos rakendatud summutamise ja üldistamisega.
Märkus: me kasutame pilte illustratiivsetel eesmärkidel. Sama põhimõte kehtib ka struktureeritud andmekogumite kohta.
See tutvustab kompromissi andmete utiliidi ja privaatsuse kaitse vahel, kus klassikalised anonüümseks muutmise meetodid pakuvad alati mõlema optimaalset kombinatsiooni.
Ei. See on suur eksiarvamus ega too kaasa anonüümseid andmeid. Kas rakendate seda endiselt andmekogumi anonüümseks muutmiseks? Siis on see blogi teie jaoks kohustuslik lugemine.
Syntho arendab tarkvara värskete andmekirjete täiesti uue andmestiku loomiseks. Teavet reaalsete isikute tuvastamiseks sünteetilises andmekogus lihtsalt pole. Kuna sünteetilised andmed sisaldavad tarkvara genereeritud tehisandmete kirjeid, ei ole isikuandmeid lihtsalt olemas, mille tulemuseks on olukord, kus puudub privaatsusrisk.
Peamine erinevus Syntho's: rakendame masinõpet. Sellest tulenevalt taasesitab meie lahendus sünteetilise andmekogumi algse andmestiku struktuuri ja omadusi, mille tulemuseks on maksimeeritud andmete kasulikkus. Seega saate sünteetiliste andmete analüüsimisel saada samu tulemusi kui esialgsete andmete kasutamisel.
See juhtumiuuring näitab meie kvaliteediaruande esiletõstmist, mis sisaldab erinevat statistikat meie Syntho Engine'i kaudu loodud sünteetilistest andmetest võrreldes algandmetega.
Kokkuvõtteks võib öelda, et sünteetilised andmed on eelistatud lahendus, et ületada tüüpiline ebaoptimaalne kompromiss andmete kasulikkuse ja privaatsuse kaitse vahel, mida pakuvad teile kõik klassikalised anonüümimise meetodid.
Kokkuvõtteks võib öelda, et andmete utiliidi ja privaatsuse kaitse seisukohast tuleks alati valida sünteetilised andmed, kui teie kasutusjuhtum seda võimaldab.
Analüüsi väärtus | Privaatsusrisk | |
Sünteetilised andmed | Suur | mitte ükski |
Tegelikud (isiklikud) andmed | Suur | Suur |
Manipuleeritud andmed (klassikalise anonüümseks muutmise kaudu) | Madal-keskmine | Keskmisel kõrgusel |
Syntho sünteetilised andmed täidavad lünki, kus klassikalised anonüümimismeetodid jäävad puudu, maksimeerides mõlemat andmete utiliit ja privaatsuse kaitse.