Пры класічнай ананімізацыі мы маем на ўвазе ўсе метадалогіі, у якіх маніпулюе або скажае зыходны набор дадзеных, каб перашкодзіць вышуку асоб.
Тыповыя прыклады класічнай ананімізацыі, якія мы бачым на практыцы, - гэта абагульненне, падаўленне / выціранне, псеўданімізацыя і перамешванне радкоў і слупкоў.
Тым самым гэтыя метады з адпаведнымі прыкладамі.
Тэхніка | Зыходныя дадзеныя | Апрацаваныя дадзеныя |
абагульненне | 27 гадоў | Ад 25 да 30 гадоў |
Падаўленне / Выціранне | info@syntho.ai | xxxx@xxxxxx.xx |
Псеўданімізацыя | Амстэрдам | hVFD6td3jdHHj78ghdgrewui6 |
Перамешванне радкоў і слупкоў | выраўнаваны | Перамешаныя |
Маніпуляванне наборам дадзеных з класічнымі метадамі ананімізацыі прыводзіць да двух ключавых недахопаў:
Мы дэманструем гэтыя 2 ключавыя недахопы, карыснасць дадзеных і абарону прыватнасці. Мы робім гэта з наступнай ілюстрацыяй з прыкладным падаўленнем і абагульненнем.
Заўвага: мы выкарыстоўваем выявы ў ілюстрацыйных мэтах. Той жа прынцып дзейнічае і для структураваных набораў дадзеных.
Гэта ўводзіць кампраміс паміж утылітай перадачы дадзеных і абаронай прыватнасці, дзе класічныя метады ананімізацыі заўсёды прапануюць неаптымальную камбінацыю абодвух.
Не. Гэта вялікая памылка і не прыводзіць да ананімных дадзеных. Вы ўсё яшчэ ўжываеце гэта як спосаб ананімізацыі вашага набору дадзеных? Тады гэты блог абавязкова трэба прачытаць для вас.
Syntho распрацоўвае праграмнае забеспячэнне для стварэння цалкам новага набору свежых запісаў дадзеных. Інфармацыі для ідэнтыфікацыі сапраўдных асоб проста няма ў сінтэтычным наборы даных. Паколькі сінтэтычныя дадзеныя ўтрымліваюць запісы штучных дадзеных, якія ствараюцца праграмным забеспячэннем, асабістых дадзеных проста няма, што прыводзіць да сітуацыі без рызык для прыватнасці.
Ключавая розніца ў Syntho: мы ўжываем машыннае навучанне. Такім чынам, наша рашэнне прайгравае структуру і ўласцівасці зыходнага набору дадзеных у сінтэтычным наборы дадзеных, што прыводзіць да максімальнай карыснасці дадзеных. Адпаведна, вы зможаце атрымаць аналагічныя вынікі пры аналізе сінтэтычных дадзеных у параўнанні з выкарыстаннем зыходных дадзеных.
Гэта тэматычнае даследаванне дэманструе асноўныя моманты з нашага справаздачы аб якасці, які змяшчае розныя статыстычныя дадзеныя з сінтэтычных дадзеных, атрыманых з дапамогай нашага Syntho Engine у параўнанні з зыходнымі дадзенымі.
У заключэнне можна сказаць, што сінтэтычныя дадзеныя з'яўляюцца пераважным рашэннем для пераадолення тыповага неаптымальнага кампрамісу паміж карыснасцю дадзеных і абаронай прыватнасці, які прапануюць вам усе класічныя метады ананімізацыі.
У заключэнне, з пункту гледжання карыснасці дадзеных і абароны прыватнасці, заўсёды варта выбіраць сінтэтычныя дадзеныя, калі ваш варыянт выкарыстання дазваляе.
Значэнне для аналізу | Рызыка прыватнасці | |
Сінтэтычныя дадзеныя | высокая | ні адзін |
Рэальныя (асабістыя) дадзеныя | высокая | высокая |
Апрацаваныя дадзеныя (праз класічную "ананімізацыю") | Нізка-сярэдні | Сярэдняй Вышыні |
Сінтэтычныя дадзеныя кампаніі Syntho запаўняюць прабелы, калі класічныя метады ананімізацыі не дасягаюць максімуму абодвух утыліта дадзеных і абарона прыватнасці.