生成合成数据时的隐私保护措施

在合成数据集时,合成数据必须不包含可用于重新识别个人的敏感信息。 这样,我们可以保证合成数据中没有 PII。 在下面的视频中,Marijn 介绍了我们质量报告中的隐私措施来证明这一点。

该视频来自 Syntho x SAS D[N]A Café,关于 AI 生成的合成数据。 在这里找到完整的视频。

我们在生成合成数据时采取了哪些隐私保护措施?

主要是,这些是防止过度拟合的指标,着眼于距离测量。 这意味着他们检查合成数据与原始数据的接近程度。 如果距离太近,则可能存在隐私风险。 这些指标确保合成数据不会太接近原始数据。 此外,在执行此操作时,Syntho Engine 还使用一个保持集来以公平的方式执行此操作。

一群人微笑着

数据是合成的,但我们的团队是真实的!

联系合成 我们的一位专家将以光速与您取得联系,探索合成数据的价值!