합성 데이터 생성 시 개인 정보 보호 조치

데이터 세트를 합성할 때 합성 데이터에는 개인을 재식별하는 데 사용할 수 있는 민감한 정보가 포함되어 있지 않아야 합니다. 이렇게 하면 합성 데이터에 PII가 없음을 보장할 수 있습니다. 아래 비디오에서 Marijn은 이를 입증하기 위해 품질 보고서에 있는 개인 정보 보호 조치를 소개합니다.

이 비디오는 Syntho x SAS D[N]A Café에서 AI 생성 합성 데이터에 대해 캡처한 것입니다. 여기에서 전체 비디오를 찾으십시오.

합성 데이터를 생성할 때 취하는 개인 정보 보호 조치는 무엇입니까?

주로 거리 측정을 보면 과적합을 방지하기 위한 메트릭입니다. 즉, 합성 데이터가 원본 데이터와 얼마나 가까운지 확인합니다. 너무 가까우면 프라이버시 위험이 있을 수 있습니다. 이러한 메트릭은 합성 데이터가 원본 데이터에 너무 근접하지 않도록 합니다. 또한 이 작업을 수행할 때 Syntho Engine은 홀드아웃 세트도 사용하여 공정한 방식으로 이를 수행할 수 있습니다.

웃고 있는 사람들의 그룹

데이터는 합성이지만 우리 팀은 진짜입니다!

신토에 문의 그리고 우리 전문가 중 한 명이 합성 데이터의 가치를 탐구하기 위해 빛의 속도로 연락을 드릴 것입니다!