Syntho的质量保证报告

评估生成的合成数据的准确性、隐私性和速度

Syntho的质量保证报告

质量保证报告简介

什么是质量保证报告?

Syntho 的质量保证报告评估生成的合成数据,并展示合成数据与原始数据相比的准确性、隐私性和速度。

为什么我们为每个生成的合成数据集提供质量保证报告?

在 Syntho,我们了解可靠且准确的合成数据的重要性。这就是为什么我们为每次合成数据运行提供全面的质量保证报告。我们的质量报告包括各种指标,例如分布、相关性、多元分布、隐私指标等。通过这种方式,您可以轻松评估我们提供的合成数据是否具有最高质量,并且可以与您的原始数据具有相同水平的准确性和可靠性。

我们在质量保证报告中评估什么?

  • 准确性
  • 隐私政策
  • 迅速的

综合数据准确性指标

概览:本节介绍了我们的综合数据质量报告中的亮点。我们的评估将合成数据与各个维度的真实数据进行比较。

分布

合成数据分布与真实数据的比较

分布说明了给定类别或值内变量的频率,并由 Syntho 引擎准确捕获。

相关性

合成数据与真实数据的相关性

相关性显示变量之间的关系,说明变量的相关程度。 Syntho 引擎准确地捕捉这些关系。

多变量

合成数据多元分布与真实数据的比较

多元分布和多元相关性使我们超越了单一维度,提供了多个变量如何相关的全面视图。 Syntho 引擎捕获这些关系。

你有任何问题吗?

与我们的一位专家交谈

综合数据隐私指标

为什么合成数据隐私指标具有相关性?

合成数据生成很复杂,并且确实存在陷阱,必须加以控制。对于人工智能算法来说,过度拟合是一种风险,人工智能合成数据生成也是如此。因此,在生成合成数据时应该控制过度拟合的风险。 Syntho 引擎控制了过度拟合的风险。最重要的是,Syntho 质量保证 (QA) 报告允许组织证明合成数据没有过度拟合原始数据。我们还评估更多与隐私相关的方面,这些方面经常被内部审计师使用。

测试完全匹配

使用相同匹配率 (IMR) 测试“精确匹配”

证明合成数据记录与原始数据中的真实记录相匹配的比率不会显着大于分析列车数据时预期的比率。

相似匹配测试

测试 “类似的比赛” 与最近记录的距离 (DCR)

证明合成数据记录与原始数据中最接近的实际记录的归一化距离并不比分析列车数据时预期的距离显着更近。

异常值测试

测试 “异常值”与 最近邻距离比 (NNDR)

证明最近和次近的合成记录与原始数据中最接近的记录之间的距离比率并不明显小于训练数据的预期比率。

索取质量保证报告

这只是总结我们的合成数据质量探索和质量保证报告本质的一个快照。它提供了对分布、相关性和多元分布的细致理解,这些分布是由 Syntho 引擎的高级功能捕获的合成数据的一部分。有关我们的质量保证报告的更多详细信息可根据要求提供。

用户文档

索取 Syntho 的用户文档!