Medidas de proteção de privacidade ao gerar dados sintéticos

Ao sintetizar um conjunto de dados, é essencial que os dados sintéticos não contenham informações confidenciais que possam ser usadas para reidentificar indivíduos. Dessa forma, podemos garantir que não há PII nos dados sintéticos. No vídeo abaixo, Marijn apresenta medidas de privacidade que estão em nosso relatório de qualidade para demonstrar isso.

Este vídeo foi capturado do Syntho x SAS D [N] A Café sobre dados sintéticos gerados por IA. Encontre o vídeo completo aqui.

Quais são as medidas de proteção de privacidade que tomamos ao gerar dados sintéticos?

Principalmente, essas são métricas para evitar overfitting, olhando para medidas de distância. Isso significa que eles verificam quão próximos os dados sintéticos estão dos dados originais. Se isso chegar muito perto, pode haver um risco de privacidade. Essas métricas garantem que os dados sintéticos não cheguem muito perto dos dados originais. Além disso, ao fazer isso, o Syntho Engine também usa um conjunto de espera para poder fazer isso de maneira justa.

grupo de pessoas sorrindo

Os dados são sintéticos, mas nossa equipe é real!

Contactar a Syntho e um de nossos especialistas entrará em contato com você na velocidade da luz para explorar o valor dos dados sintéticos!