Mei klassike anonimisaasje ymplisearje wy alle metodyken wêr't men in orizjinele dataset manipuleart of ferfoarme om it weromlûken fan persoanen te hinderjen.
Typyske foarbylden fan klassike anonymisaasje dy't wy yn 'e praktyk sjogge, binne generalisaasje, ûnderdrukking / wiskjen, pseudonymisaasje en shuffling fan rigen en kolommen.
Hjirby dy techniken mei oerienkommende foarbylden.
Technyk | Oarspronklike gegevens | Manipulearre gegevens |
Generalisearring | 27 jier âld | Tusken 25 en 30 jier âld |
Underdrukking / wiskjen | info@syntho.ai | xxxx@xxxxxx.xx |
Pseudonymisaasje | Amsterdam | hVFD6td3jdHHj78ghdgrewui6 |
Rige en kolom skommelje | Alined | Skommele |
It manipulearjen fan in dataset mei klassike anonymisaasjetechniken resultearret yn 2 kaaien neidielen:
Wy demonstrearje dy 2 wichtige neidielen, gegevenshulpprogramma en privacybeskerming. Wy dogge dat mei de folgjende yllustraasje mei tapaste ûnderdrukking en generalisaasje.
Opmerking: wy brûke ôfbyldings foar yllustrative doelen. Itselde prinsipe jildt foar struktureare datasets.
Dit yntrodusearret de trade-off tusken gegevenshulpprogramma en privacybeskerming, wêr't klassike anonymisaasjetechniken altyd in suboptimale kombinaasje fan beide biede.
Nee. Dit is in grutte misferstân en resultearret net yn anonime gegevens. Tapasse jo dit noch altyd as manier om jo dataset anonymisearje? Dan is dit blog in must -read foar jo.
Syntho ûntwikkelt software om in folslein nije dataset fan farske gegevensrekords te generearjen. Ynformaasje om echte persoanen te identifisearjen is gewoan net oanwêzich yn in syntetyske dataset. Om't syntetyske gegevens artysten gegevensrecords befetsje genereare troch software, binne persoanlike gegevens gewoan net oanwêzich, wat resulteart yn in situaasje sûnder privacy risiko's.
It wichtichste ferskil by Syntho: wy tapasse machine learning. Dêrom reprodusearret ús oplossing de struktuer en eigenskippen fan 'e orizjinele dataset yn' e syntetyske dataset dy't resulteart yn maksimalisearre data-nut. Dêrom sille jo deselde resultaten kinne krije by it analysearjen fan de syntetyske gegevens yn ferliking mei it brûken fan 'e orizjinele gegevens.
Dizze saakstúdzje toant hichtepunten út ús kwaliteitsrapport mei ferskate statistiken mei syntetyske gegevens genereare fia ús Syntho Engine yn ferliking mei de orizjinele gegevens.
Ta beslút, syntetyske gegevens is de foarkommende oplossing om de typyske sub-optimale ôfwikseling te oerwinnen tusken data-hulpprogramma en privacy-beskerming, dy't alle klassike anonymisaasjetechniken jo oanbiede.
Ta beslút, út in perspektyf op gegevenshulpprogramma en privacybeskerming, moat men altyd kieze foar syntetyske gegevens as jo gebrûkssaak dat tastiet.
Wearde foar analyse | Privacyrisiko | |
Syntetyske gegevens | heech | Gjin |
Echte (persoanlike) gegevens | heech | heech |
Manipulearre gegevens (fia klassike 'anonymisaasje') | Leech-Medium | Medium-Heech |
Syntetyske gegevens fan Syntho folje de gatten wêr't klassike anonymisaasjetechniken te koart falle troch beide te maksimalisearjen data-hulpprogramma en privacy-beskerming.