A klasszikus anonimizálásnál minden olyan módszert alkalmazunk, ahol az eredeti adatkészletet manipulálja vagy torzítja, hogy megakadályozza az egyének visszavezetését.
A klasszikus anonimizáció tipikus példái, amelyeket a gyakorlatban látunk, az általánosítás, az elnyomás / törlés, az álnevesítés és a sorok és oszlopok keverése.
Ezennel ezek a technikák a megfelelő példákkal.
Technika | Eredeti adatok | Manipulált adatok |
Általánosítás | 27 éves | 25 és 30 év között |
Elnyomás / törlés | info@syntho.ai | xxxx@xxxxxx.xx |
Álnevesítés | Amszterdam | hVFD6td3jdHHj78ghdgrewui6 |
Sorok és oszlopok keverése | Igazítva | Keverve |
Az adathalmaz klasszikus anonimizálási technikákkal történő manipulálása két fő hátrányt eredményez:
Bemutatjuk ezt a két kulcsfontosságú hátrányt, az adathasználatot és a magánélet védelmét. Ezt a következő illusztrációval tesszük, alkalmazott elnyomással és általánosítással.
Megjegyzés: a képeket illusztrációs célokra használjuk. Ugyanez az elv érvényes a strukturált adatkészletekre is.
Ez bevezeti a kompromisszumot az adatszolgáltatás és a magánélet védelme között, ahol a klasszikus anonimizálási technikák mindig mindkettő optimális kombinációját kínálják.
Nem. Ez egy nagy tévhit, és nem eredményez névtelen adatokat. Még mindig alkalmazza ezt az adathalmaz névtelenítésére? Akkor ezt a blogot kötelező olvasnod kell neked.
A Syntho szoftvert fejleszt, hogy teljesen új adatállományt hozzon létre friss adatrekordokból. A valós személyek azonosítására szolgáló információ egyszerűen nincs jelen egy szintetikus adathalmazban. Mivel a szintetikus adatok szoftverek által előállított mesterséges adatrekordokat tartalmaznak, a személyes adatok egyszerűen nincsenek jelen, ami magánéleti kockázatokat nem okozó helyzetet eredményez.
A legfontosabb különbség a Syntho -nál: gépi tanulást alkalmazunk. Következésképpen megoldásunk reprodukálja az eredeti adatkészlet szerkezetét és tulajdonságait a szintetikus adatkészletben, ami maximális adathasznosítást eredményez. Ennek megfelelően ugyanazokat az eredményeket érheti el a szintetikus adatok elemzésekor, mint az eredeti adatok felhasználásával.
Ez az esettanulmány bemutatja a Syntho Engine által generált szintetikus adatok különböző statisztikáit tartalmazó minőségi jelentésünk kiemelkedő értékeit az eredeti adatokhoz képest.
Összefoglalva, a szintetikus adatok az előnyben részesített megoldás az adat-hasznosság és a magánélet védelme közötti tipikus, nem optimális kompromisszum leküzdésére, amelyet minden klasszikus anonimizálási technika kínál.
Összefoglalva, az adatszolgáltatás és a magánélet védelme szempontjából mindig a szintetikus adatok mellett kell dönteni, ha a használati eset ezt lehetővé teszi.
Érték az elemzéshez | Adatvédelmi kockázat | |
Szintetikus adatok | Magas | Egyik sem |
Valós (személyes) adatok | Magas | Magas |
Manipulált adatok (klasszikus „névtelenítés”) | Alacsony-közepes | Közepesen magas |
A Syntho szintetikus adatai mindkettő maximalizálásával pótolják azokat a hiányosságokat, ahol a klasszikus anonimizálási technikák elmaradnak adat-segédprogram és a magánszféra védelem.