Nima uchun klassik anonimlashtirish (va taxalluslashtirish) anonim ma'lumotlarga olib kelmaydi

Klassik anonimlashtirish nima?

Klassik anonimlashtirishda biz shaxslarni izlashga to'sqinlik qilish uchun asl ma'lumotlar to'plamini o'zgartiradigan yoki buzadigan barcha metodologiyalarni nazarda tutamiz.

Amalda biz ko'rib turgan klassik anonimlashtirishning odatiy misollari - bu umumlashtirish, o'chirish / o'chirish, taxalluslashtirish va qatorlar va ustunlarni aralashtirish.

Bu usullar tegishli misollar bilan.

texnika Asl ma'lumotlar Manipulyatsiya qilingan ma'lumotlar
Boshlash 27 yoshda 25 yoshdan 30 yoshgacha
Bosish / tozalash info@syntho.ai xxxx@xxxxxx.xx
Pseudonymizatsiya Amsterdam hVFD6td3jdHHj78ghdgrewui6
Qator va ustunlarni aralashtirish Hizalanmış Xiralashgan

Klassik anonimlashtirishning kamchiliklari nimada?

Ma'lumotlar to'plamini anonimlashtirishning klassik usullari bilan ishlash ikkita asosiy kamchilikka olib keladi:

  1. Ma'lumotlar majmuasini buzish ma'lumotlar sifatining pasayishiga olib keladi (ya'ni, ma'lumotlarning yordamchi dasturi). Bu axlatni tozalashning klassik tamoyilini joriy qiladi.
  2. Maxfiylik xavfi kamayadi, lekin har doim mavjud bo'ladi. U 1-1 aloqada bo'lgan asl ma'lumotlar to'plamining versiyasi bo'lib qoladi.

Biz ushbu ikkita asosiy kamchiliklarni, ma'lumotlarning yordami va maxfiylikni himoya qilishni ko'rsatamiz. Biz buni quyidagi tasvir yordamida amaliy bostirish va umumlashtirish yordamida qilamiz.

E'tibor bering: biz tasvirlarni tasviriy maqsadda ishlatamiz. Xuddi shu tamoyil tuzilgan ma'lumotlar to'plamlari uchun ham amal qiladi.

Klassik anonimlashtirish muvaffaqiyatsiz tugadi
  • Chapdan: klassik anonimlashtirishning kam qo'llanilishi vakillik illyustratsiyasiga olib keladi. Biroq, shaxsni osongina aniqlash mumkin va maxfiylik xavfi katta.

 

  • O'ng: Klassik anonimlashtirishning qattiq qo'llanilishi maxfiylik himoyasi kuchli bo'lishiga olib keladi. Biroq, rasm befoyda bo'lib qoladi.

Klassik anonimlashtirish usullari ma'lumotlar-kommunal va maxfiylik himoyasi o'rtasidagi maqbul kombinatsiyani taklif qiladi.

Bu ma'lumotlar maxfiyligi va maxfiylikni himoya qilish o'rtasidagi farqni ko'rsatadi, bu erda anonimlashtirishning klassik usullari har doim ikkalasining ham eng maqbul kombinatsiyasini taklif qiladi. 

anonimlashtirishning klassik egri chizig'i

Ma'lumotlar to'plamidan barcha to'g'ridan -to'g'ri identifikatorlarni (masalan, ismlar) olib tashlash hal qilinadimi?

Yo'q. Bu katta noto'g'ri tushuncha va anonim ma'lumotlarga olib kelmaydi. Siz buni hali ham ma'lumotlar bazasini anonim qilish uchun qo'llaysizmi? Keyin bu blog siz uchun o'qilishi shart.

Sintetik ma'lumotlar qanday farq qiladi?

Syntho butunlay yangi ma'lumotlar to'plamini yaratish uchun dasturiy ta'minot ishlab chiqadi. Haqiqiy shaxslarni aniqlash uchun ma'lumot sintetik ma'lumotlar to'plamida mavjud emas. Sintetik ma'lumotlar dasturiy ta'minot tomonidan yaratilgan sun'iy ma'lumotlar yozuvlarini o'z ichiga olganligi sababli, shaxsiy ma'lumotlar shunchaki mavjud emas, natijada maxfiylik xavfi yo'q.

Syntho -dagi asosiy farq: biz mashinani o'rganishni qo'llaymiz. Shunday qilib, bizning echimimiz sintetik ma'lumotlar bazasida asl ma'lumotlar to'plamining tuzilishi va xususiyatlarini aks ettiradi, natijada ma'lumotlar maksimal darajada foydali bo'ladi. Shunga ko'ra, siz sintetik ma'lumotlarni tahlil qilishda asl ma'lumotlardan foydalanganingizdagidek bir xil natijalarga erisha olasiz.

Bu amaliy ish Bizning Syntho dvigatelimiz orqali yaratilgan sintetik ma'lumotlarning har xil statistikasini o'z ichiga olgan sifat hisobotimizdagi asosiy ma'lumotlarni asl ma'lumotlarga nisbatan namoyish etadi.

Xulosa qilib aytganda, sintetik ma'lumotlar-bu maxfiylik va maxfiylik himoyasi o'rtasidagi odatiy maqbul almashinuvni engib o'tishning eng maqbul echimi, bu sizga anonimlashtirishning barcha klassik usullari taklif qiladi.

anonimlashtirishning klassik egri chizig'i

Xo'sh, nima uchun sintetik ma'lumotlardan foydalanish mumkin bo'lsa, haqiqiy (sezgir) ma'lumotlardan foydalanish kerak?

Xulosa qilib aytganda, ma'lumotlarning maxfiyligi va maxfiyligini himoya qilish nuqtai nazaridan, agar sizning shaxsiy holatingiz bunga ruxsat bersa, har doim sintetik ma'lumotlarni tanlash kerak.

 Tahlil qilish uchun qiymatMaxfiylik xavfi
Sintetik ma'lumotlarbalandhech qaysi
Haqiqiy (shaxsiy) ma'lumotlarbalandbaland
Manipulyatsiya qilingan ma'lumotlar (klassik "anonimlashtirish" orqali)Past-O'rtaO'rta-baland
fikr

Syntho -ning sintetik ma'lumotlari, anonimlashtirishning klassik usullari ikkalasini ham maksimal darajada oshirish orqali kamchiliklarni to'ldiradi ma'lumotlar yordam dasturi va maxfiylik himoyasi.

Qiziq emasmi?

Biz bilan sintetik ma'lumotlarning qo'shimcha qiymatini o'rganing