Integritetsskyddsåtgärder vid generering av syntetiska data

När man syntetiserar en datauppsättning är det viktigt att den syntetiska informationen inte innehåller någon känslig information som kan användas för att omidentifiera individer. På så sätt kan vi garantera att det inte finns någon PII i den syntetiska datan. I videon nedan introducerar Marijn integritetsåtgärder som finns i vår kvalitetsrapport för att visa detta.

Den här videon är hämtad från Syntho x SAS D[N]A Café om AI-genererad syntetisk data. Hitta hela videon här.

Vilka integritetsskyddsåtgärder vidtar vi när vi genererar syntetisk data?

Främst är det mått för att förhindra överanpassning, när man tittar på avståndsmått. Det betyder att de kontrollerar hur nära den syntetiska datan är originaldatan. Om det kommer för nära kan det finnas en integritetsrisk. Dessa mätvärden ser till att syntetiska data inte kommer för nära originaldata. Dessutom, när du gör detta, använder Syntho Engine också en holdout-uppsättning för att kunna göra detta på ett rättvist sätt.

grupp människor ler

Data är syntetisk, men vårt team är verkligt!

Kontakta Syntho och en av våra experter kommer att kontakta dig med ljusets hastighet för att utforska värdet av syntetiska data!