Maatregelen ter bescherming van de privacy bij het genereren van synthetische data

Bij het samenstellen van een dataset is het essentieel dat de synthetische data geen gevoelige informatie bevatten die kan worden gebruikt om individuen opnieuw te identificeren. Op deze manier kunnen we garanderen dat er geen PII in de synthetische data zit. In onderstaande video introduceert Marijn privacymaatregelen die in ons kwaliteitsrapport staan ​​om dit aan te tonen.

Deze video is gemaakt vanuit het Syntho x SAS D[N]A Café over AI Generated Synthetic Data. Vind de volledige video hier.

Wat zijn de privacybeschermingsmaatregelen die we nemen bij het genereren van synthetische data?

Dat zijn voornamelijk metrische data om overfitting te voorkomen, kijkend naar afstandsmaten. Dit betekent dat ze controleren hoe dicht de synthetische data bij de originele data liggen. Als dat te dichtbij komt, kan er een privacyrisico ontstaan. Deze metrische data zorgen ervoor dat de synthetische data niet te dicht bij de oorspronkelijke data komen. Daarbij maakt de Syntho Engine ook gebruik van een holdout set om dit op een eerlijke manier te kunnen doen.

Gegevens zijn synthetisch, maar ons team is echt!

Neem contact op met Syntho en een van onze experts neemt razendsnel contact met je op om de waarde van synthetische data te onderzoeken!