Эмне үчүн классикалык анонимизация (жана псевдонимизация) анонимдүү маалыматтарга алып келбейт

Классикалык анонимизация деген эмне?

Классикалык анонимдештирүү менен, биз жеке методологияны билдиребиз, бул жерде кимдир бирөөнү издөөгө тоскоолдук кылуу үчүн баштапкы маалымат базасы иштетилет же бурмаланат.

Биз практикада көргөн классикалык анонимизациянын типтүү мисалдары - бул жалпылоо, басуу / аарчуу, псевдонимизация жана катар менен мамычаларды аралаштыруу.

Бул жерде тиешелүү мисалдар менен ошол техникалар.

техника Түпнуска маалыматтар Манипуляцияланган маалыматтар
жалпылоо 27 жашта 25 жаштан 30 жашка чейин
Басуу / сүртүү info@syntho.ai xxxx@xxxxxx.xx
Псевдонимизация амстердам hVFD6td3jdHHj78ghdgrewui6
Катар менен мамычаны аралаштыруу Түзүлдү Аралашты

Классикалык анонимизациянын кандай кемчиликтери бар?

Классикалык анонимдештирүү методдору менен маалымат базасын манипуляциялоо 2 ачкыч кемчиликтерге алып келет:

  1. Берилиштер базасын бурмалоо маалымат сапатынын төмөндөшүнө алып келет (б.а. маалыматтардын утилитасы). Бул таштандыга таштанды чыгаруунун классикалык принцибин киргизет.
  2. Купуялык коркунучу азаят, бирок дайыма бар болот. Бул 1-1 катнаштары менен баштапкы маалымат топтомунун версиясы калат.

Биз ошол 2 негизги кемчиликти, маалыматтын пайдалуулугун жана купуялыкты коргоону көрсөтөбүз. Биз муну төмөнкү иллюстрация менен колдонулган басуу жана жалпылоо менен жасайбыз.

Эскертүү: биз сүрөттөрдү иллюстрациялоо максатында колдонобуз. Ушул эле принцип структураланган маалымат топтомдоруна да тиешелүү.

Классикалык анонимизация ишке ашпай калды
  • сол жактан: классикалык анонимизацияны аз колдонуу репрезентативдүү иллюстрацияга алып келет. Бирок, инсанды оңой эле аныктаса болот жана купуялуулук коркунучу чоң.

 

  • Right: классикалык анонимизацияны катуу колдонуу купуялуулукту күчтүү коргоого алып келет. Бирок, мисал пайдасыз болуп калат.

Классикалык анонимдештирүү методдору маалыматтын пайдалуулугу менен купуялуулукту коргоонун ортосундагы оптималдуу айкалышты сунуштайт.

Бул классикалык анонимдештирүү ыкмалары дайыма экөөнүн тең оптималдуу айкалышын сунуштаган маалыматтардын пайдалуулугу менен купуялыкты коргоонун ортосундагы соода-сатыкты киргизет. 

классикалык анонимдөө пайдалуу ийри сызыгы

Берилиштер топтомунан бардык түз идентификаторлорду (мисалы, аттарды) алып салуу чечим болуп жатабы?

Жок. Бул чоң жаңылыштык жана анонимдүү маалыматтарга алып келбейт. Сиз муну маалымат топтомун анонимдештирүү үчүн дагы эле колдоносузбу? Анда бул блог сиз үчүн окулушу керек.

Синтетикалык маалыматтын эмнеси менен айырмаланат?

Syntho жаңы маалымат жазуулардын таптакыр жаңы маалымат топтомун түзүү үчүн программалык камсыздоону иштеп чыгат. Чыныгы адамдарды аныктоо үчүн маалымат синтетикалык маалымат базасында жок. Синтетикалык маалымат программалык камсыздоо тарабынан түзүлгөн жасалма маалымат жазууларын камтыгандыктан, жеке маалыматтар эч кандай купуялуулук тобокелчилиги жок абалга алып келет.

Syntho'догу негизги айырма: биз машинаны үйрөнүүнү колдонобуз. Демек, биздин чечимибиз синтетикалык берилиштердеги баштапкы маалымат базасынын структурасын жана касиеттерин кайра чыгарат, натыйжада максималдуу маалымат-пайдалуу. Демек, синтетикалык маалыматтарды анализдөөдө баштапкы маалыматтарды колдонууга салыштырмалуу ошол эле натыйжаларды ала аласыз.

Бул мисал изилдөө баштапкы маалыматтарга салыштырмалуу Syntho Engine аркылуу түзүлгөн синтетикалык маалыматтардын ар кандай статистикасын камтыган сапат отчетубуздун урунттуу учурларын көрсөтөт.

Жыйынтыктасак, синтетикалык маалыматтар классикалык анонимизациянын бардык ыкмалары сизге сунуштаган маалыматтардын пайдалуулугу менен купуялыкты коргоонун ортосундагы типтүү оптималдуу соодалашууну жеңүү үчүн артыкчылыктуу чечим болуп саналат.

классикалык анонимдөө пайдалуу ийри сызыгы

Демек, синтетикалык маалыматтарды колдоно алганда, эмне үчүн чыныгы (сезимтал) маалыматтарды колдонуш керек?

Жыйынтыктасак, маалымат-коммуналдык жана купуялуулукту коргоо көз карашынан алганда, эгерде сиздин колдонмоңуз уруксат берсе, синтетикалык маалыматтарды тандап алуу керек.

 Анализдин маанисиКупуялык коркунучу
Синтетикалык маалыматтарбийикэч ким
Чыныгы (жеке) маалыматтарбийикбийик
Манипуляцияланган маалыматтар (классикалык "анонимизация" аркылуу)Төмөн-ОртоОрто-Бийик
ой

Syntho тарабынан жасалган синтетикалык маалыматтар экөөнү тең максималдаштыруу аркылуу классикалык анонимдештирүү ыкмалары жетишпеген жерлерди толтурат маалымат-коммуналдык жана купуялык коргоо.

Кызыгасызбы?

Биз менен синтетикалык маалыматтын кошумча наркын изилдеңиз