Неліктен классикалық анонимизация (және жалған атау) анонимді деректерге әкелмейді

Классикалық анонимизация дегеніміз не?

Классикалық анонимизация кезінде біз жеке деректерді іздеуге кедергі жасау үшін түпнұсқалық деректер жиынтығын өңдейтін немесе бұрмалайтын барлық әдістерді қолданамыз.

Біз практикада көріп жүрген классикалық анонимизацияның типтік мысалдары - бұл жалпылау, басу / сүрту, бүркеншік атау және жолдар мен бағаналардың ауысуы.

Осы әдістер сәйкес мысалдармен.

техника Түпнұсқа деректер Манипуляцияланған деректер
Жалпылау 27 жасқа 25 бен 30 жас аралығында
Басу / сүрту info@syntho.ai xxxx@xxxxxx.xx
Псевдонимизация Амстердам hVFD6td3jdHHj78ghdgrewui6
Жолдар мен бағаналардың ауысуы Тураланған Араластырылды

Классикалық анонимизацияның кемшіліктері қандай?

Классикалық анонимизация әдістерінің көмегімен деректер жиынтығын өңдеу екі кедергілерге әкеледі:

  1. Деректер жиынтығының бұрмалануы мәліметтер сапасының төмендеуіне әкеледі (яғни мәліметтер утилитасы). Бұл қоқыс шығарудың классикалық принципін енгізеді.
  2. Құпиялылық қаупі азаяды, бірақ әрқашан қатысатын болады. Ол 1-1 қатынастары бар бастапқы деректер жиынтығының нұсқасы болып қалады.

Біз бұл 2 негізгі кемшіліктерді, деректердің утилитасы мен құпиялылықты қорғауды көрсетеміз. Біз мұны келесі иллюстрация арқылы жасаймыз және басамыз.

Ескерту: біз суреттерді иллюстрациялық мақсатта қолданамыз. Дәл сол принцип құрылымдалған деректер жиынтығына қатысты.

Классикалық анонимизация сәтсіз аяқталды
  • Сол: классикалық анонимизацияны аз қолдану репрезентативті иллюстрацияға әкеледі. Дегенмен, жеке тұлғаны оңай тануға болады және жеке өмірге қауіп төнеді.

 

  • Оң: классикалық анонимизацияны қатаң қолдану құпиялылықты қорғауға әкеледі. Алайда иллюстрация пайдасыз болады.

Классикалық анонимизация әдістері деректерді пайдалану мен құпиялылықты қорғау арасындағы оптималды комбинацияны ұсынады.

Бұл анонимизацияның классикалық әдістері әрқашан екеуінің де оптималды комбинациясын ұсынатын мәліметтер утилитасы мен құпиялылықты қорғау арасындағы айырмашылықты енгізеді. 

классикалық анонимизация утилитасының қисығы

Деректер жиынтығынан барлық тікелей идентификаторларды жою (мысалы, атаулар)?

Жоқ. Бұл үлкен қате түсінік және анонимді деректерге әкелмейді. Сіз бұл деректерді анонимдеу үшін әлі де қолданасыз ба? Содан кейін бұл блог сізге міндетті түрде оқылады.

Синтетикалық мәліметтердің айырмашылығы неде?

Syntho жаңа деректер жазбаларының мүлде жаңа жиынтығын құру үшін бағдарламалық қамтамасыз етуді әзірлейді. Нақты адамдарды анықтау үшін ақпарат синтетикалық деректер жиынтығында жоқ. Синтетикалық деректерде бағдарламалық жасақтама арқылы жасанды деректер жазбалары болғандықтан, жеке деректер жоқ, бұл жеке өмірге қауіп төндірмейтін жағдайға әкеледі.

Syntho -ның басты айырмашылығы: біз машиналық оқытуды қолданамыз. Демек, біздің шешім синтетикалық деректер жиынтығындағы бастапқы деректер жиынтығының құрылымы мен қасиеттерін жаңғыртады, нәтижесінде максималды деректер пайда болады. Тиісінше, сіз синтетикалық деректерді талдау кезінде түпнұсқалық деректерді қолданумен салыстырғанда дәл осындай нәтижеге қол жеткізе аласыз.

Бұл жағдайлық зерттеу түпнұсқалық деректермен салыстырғанда біздің Syntho Engine арқылы жасалған синтетикалық деректердің әр түрлі статистикасын қамтитын біздің сапалық есебіміздің маңызды сәттерін көрсетеді.

Қорытындылай келе, синтетикалық деректер-бұл анонимизацияның барлық классикалық әдістері ұсынатын деректер мен қызметтің құпиялылығын қорғау арасындағы оптимальды айырбастауды жеңудің таңдаулы шешімі.

классикалық анонимизация утилитасының қисығы

Сонымен, синтетикалық деректерді қолдана отырып, неліктен нақты (сезімтал) деректерді пайдалану керек?

Қорытындылай келе, деректердің утилитасы мен құпиялылықты қорғау тұрғысынан, егер сіздің пайдалану жағдайыңыз рұқсат етсе, әрқашан синтетикалық деректерді таңдаған жөн.

 Талдау мәніҚұпиялылық қаупі
Синтетикалық мәліметтербиікNone
Нақты (жеке) деректербиікбиік
Манипуляцияланған деректер (классикалық «анонимизация» арқылы)Орташа төменОрташа-жоғары
идея

Syntho синтетикалық деректері анонимизацияның классикалық әдістері жетіспейтін олқылықтардың орнын толтырады деректер утилитасы және құпиялылықты қорғау.

Мүдделі?

Бізбен синтетикалық деректердің қосымша құнын зерттеңіз