Mga hakbang sa proteksyon sa privacy kapag bumubuo ng sintetikong data

Kapag nagsi-synthesize ng isang dataset, mahalaga na ang synthetic na data ay hindi nagtataglay ng sensitibong impormasyon na magagamit upang muling tukuyin ang mga indibidwal. Sa ganitong paraan, magagarantiya namin na walang PII sa synthetic na data. Sa video sa ibaba, ipinakilala ni Marijn ang mga hakbang sa pagkapribado na nasa aming ulat ng kalidad upang ipakita ito.

Ang video na ito ay nakunan mula sa Syntho x SAS D[N]A Café tungkol sa AI Generated Synthetic Data. Hanapin ang buong video dito.

Ano ang mga hakbang sa proteksyon sa privacy na ginagawa namin kapag bumubuo ng synthetic na data?

Pangunahin, ang mga iyon ay mga sukatan upang maiwasan ang overfitting, tumitingin sa mga sukat ng distansya. Nangangahulugan ito na sinusuri nila kung gaano kalapit ang synthetic data sa orihinal na data. Kung masyadong malapit iyon, maaaring may panganib sa privacy. Tinitiyak ng mga sukatang ito na ang data ng synthetics ay hindi masyadong malapit sa orihinal na data. Bukod pa rito, kapag ginagawa ito, gumagamit din ang Syntho Engine ng holdout set para magawa ito sa patas na paraan.

grupo ng mga taong nakangiti

Sintetiko ang data, ngunit totoo ang aming team!

Makipag-ugnay kay Syntho at isa sa aming mga eksperto ay makikipag-ugnayan sa iyo sa bilis ng liwanag upang tuklasin ang halaga ng synthetic na data!