เหตุใดการลบชื่อแบบคลาสสิก (และการใช้นามแฝง) จึงไม่ส่งผลให้เกิดข้อมูลที่ไม่ระบุตัวตน

การลบชื่อแบบคลาสสิกคืออะไร?

ด้วยการไม่ระบุชื่อแบบคลาสสิก เราบอกเป็นนัยถึงวิธีการทั้งหมดที่มีการจัดการหรือบิดเบือนชุดข้อมูลดั้งเดิมเพื่อขัดขวางการติดตามบุคคล

ตัวอย่างทั่วไปของการไม่เปิดเผยชื่อแบบคลาสสิกที่เราเห็นในทางปฏิบัติ ได้แก่ การวางนัยทั่วไป การปราบปราม / การลบ การระบุนามแฝง และการสับแถวและคอลัมน์

ต่อไปนี้เทคนิคเหล่านั้นพร้อมตัวอย่างที่สอดคล้องกัน

เทคนิค ข้อมูลต้นฉบับ ข้อมูลที่มีการจัดการ
ลักษณะทั่วไป ปี 27 เก่า อายุระหว่าง 25 ถึง 30 ปี
ปราบปราม / เช็ด info@syntho.ai xxxx@xxxxxx.xx
นามแฝง อัมสเตอร์ดัม hVFD6td3jdHHj78ghdgreui6
การสับแถวและคอลัมน์ ชิด สับเปลี่ยน

ข้อเสียของการไม่เปิดเผยชื่อแบบคลาสสิกมีอะไรบ้าง

การจัดการชุดข้อมูลด้วยเทคนิคการปกปิดชื่อแบบคลาสสิกส่งผลให้เกิดข้อเสีย 2 ประการ:

  1. การบิดเบือนชุดข้อมูลส่งผลให้คุณภาพของข้อมูลลดลง (เช่น ยูทิลิตี้ข้อมูล) นี้แนะนำหลักการถังขยะเข้า-ออกแบบคลาสสิก
  2. ความเสี่ยงด้านความเป็นส่วนตัว จะลดลงแต่ จะคงอยู่ตลอดไป. มันยังคงอยู่และจัดการเวอร์ชันของชุดข้อมูลดั้งเดิมที่มีความสัมพันธ์แบบ 1-1

เราแสดงให้เห็นถึงข้อเสียที่สำคัญ 2 ข้อ ได้แก่ ยูทิลิตี้ข้อมูลและการปกป้องความเป็นส่วนตัว เราทำเช่นนั้นด้วยภาพประกอบต่อไปนี้โดยใช้การปราบปรามและการวางนัยทั่วไป

หมายเหตุ: เราใช้รูปภาพเพื่อจุดประสงค์ในการอธิบาย หลักการเดียวกันนี้ใช้กับชุดข้อมูลที่มีโครงสร้าง

การลบชื่อแบบคลาสสิกล้มเหลว
  • ซ้าย: การประยุกต์ใช้การลบชื่อแบบคลาสสิกเพียงเล็กน้อยส่งผลให้เกิดภาพประกอบที่เป็นตัวแทน อย่างไรก็ตาม บุคคลนั้นสามารถระบุได้ง่ายและความเสี่ยงด้านความเป็นส่วนตัวก็มีความสำคัญ

 

  • ขวา: การใช้การไม่เปิดเผยชื่อแบบคลาสสิกอย่างรุนแรงส่งผลให้มีการปกป้องความเป็นส่วนตัวที่แข็งแกร่ง อย่างไรก็ตาม ภาพประกอบจะไร้ประโยชน์

เทคนิคการลบข้อมูลระบุตัวตนแบบคลาสสิกนำเสนอการผสมผสานที่ไม่เหมาะสมระหว่างยูทิลิตี้ข้อมูลและการปกป้องความเป็นส่วนตัว

สิ่งนี้แนะนำการแลกเปลี่ยนระหว่างยูทิลิตี้ข้อมูลและการปกป้องความเป็นส่วนตัว ซึ่งเทคนิคการลบข้อมูลระบุตัวตนแบบคลาสสิกมักจะนำเสนอการผสมผสานที่ไม่เหมาะสมของทั้งสองอย่าง 

เส้นโค้งยูทิลิตี้การลบข้อมูลระบุตัวตนแบบคลาสสิก

การลบตัวระบุโดยตรงทั้งหมด (เช่นชื่อ) ออกจากชุดข้อมูลเป็นวิธีแก้ปัญหาหรือไม่

ไม่ นี่เป็นความเข้าใจผิดครั้งใหญ่และไม่ส่งผลให้มีข้อมูลที่ไม่ระบุตัวตน คุณยังคงใช้วิธีนี้เพื่อทำให้ชุดข้อมูลของคุณไม่เปิดเผยตัวตนหรือไม่ บล็อกนี้เป็นสิ่งที่ต้องอ่านสำหรับคุณ

ข้อมูลสังเคราะห์แตกต่างกันอย่างไร

Syntho พัฒนาซอฟต์แวร์เพื่อสร้างชุดข้อมูลใหม่ทั้งหมดของการบันทึกข้อมูลใหม่ ข้อมูลเพื่อระบุตัวบุคคลจริงไม่มีอยู่ในชุดข้อมูลสังเคราะห์ เนื่องจากข้อมูลสังเคราะห์ประกอบด้วยบันทึกข้อมูลเทียมที่สร้างโดยซอฟต์แวร์ ข้อมูลส่วนบุคคลจึงไม่ปรากฏ ส่งผลให้สถานการณ์ไม่มีความเสี่ยงด้านความเป็นส่วนตัว

ความแตกต่างที่สำคัญที่ Syntho: เราใช้การเรียนรู้ของเครื่อง ด้วยเหตุนี้ โซลูชันของเราจึงสร้างโครงสร้างและคุณสมบัติของชุดข้อมูลดั้งเดิมในชุดข้อมูลสังเคราะห์ซึ่งส่งผลให้มียูทิลิตี้ข้อมูลสูงสุด ดังนั้น คุณจะสามารถได้ผลลัพธ์เดียวกันเมื่อวิเคราะห์ข้อมูลสังเคราะห์เมื่อเทียบกับการใช้ข้อมูลดั้งเดิม

กรณีศึกษานี้ สาธิตไฮไลท์จากรายงานคุณภาพของเราที่มีสถิติต่างๆ จากข้อมูลสังเคราะห์ที่สร้างผ่าน Syntho Engine ของเราเมื่อเปรียบเทียบกับข้อมูลดั้งเดิม

โดยสรุป ข้อมูลสังเคราะห์เป็นโซลูชันที่ต้องการเพื่อเอาชนะการแลกเปลี่ยนระหว่างยูทิลิตี้ข้อมูลและการปกป้องความเป็นส่วนตัว ซึ่งเทคนิคการลบข้อมูลระบุตัวตนแบบคลาสสิกทั้งหมดมอบให้คุณ

เส้นโค้งยูทิลิตี้การลบข้อมูลระบุตัวตนแบบคลาสสิก

เหตุใดจึงต้องใช้ข้อมูลจริง (ละเอียดอ่อน) ในเมื่อคุณสามารถใช้ข้อมูลสังเคราะห์ได้

โดยสรุป จากมุมมองของยูทิลิตี้ข้อมูลและการปกป้องความเป็นส่วนตัว เราควรเลือกใช้ข้อมูลสังเคราะห์เสมอเมื่อกรณีการใช้งานของคุณอนุญาต

 มูลค่าสำหรับการวิเคราะห์ความเสี่ยงด้านความเป็นส่วนตัว
ข้อมูลสังเคราะห์จุดสูงไม่มี
ข้อมูลจริง (ส่วนตัว)จุดสูงจุดสูง
ข้อมูลที่มีการจัดการ (ผ่าน 'การไม่ระบุชื่อ' แบบคลาสสิก)ต่ำปานกลางกลางสูง
ความคิด

ข้อมูลสังเคราะห์โดย Syntho เติมเต็มช่องว่างที่เทคนิคการลบข้อมูลระบุตัวตนแบบคลาสสิกขาดหายไปโดยการเพิ่มทั้งสองอย่างให้มากที่สุด ข้อมูลยูทิลิตี้ และ  ความเป็นส่วนตัว-การป้องกัน.

สนใจ?

สำรวจมูลค่าเพิ่มของข้อมูลสังเคราะห์กับเรา