Rapport d'assurance qualité de Syntho

Évaluez les données synthétiques générées sur l’exactitude, la confidentialité et la vitesse

Rapport d'assurance qualité de Syntho

Rapport d'assurance qualité d'introduction

Qu'est-ce qu'un rapport d'assurance qualité ?

Le rapport d'assurance qualité de Syntho évalue les données synthétiques générées et démontre l'exactitude, la confidentialité et la rapidité des données synthétiques par rapport aux données originales.

Pourquoi fournissons-nous un rapport d’assurance qualité pour chaque ensemble de données synthétiques généré ?

Chez Syntho, nous comprenons l'importance de données synthétiques fiables et précises. C'est pourquoi nous fournissons un rapport d'assurance qualité complet pour chaque exécution de données synthétiques. Notre rapport de qualité comprend diverses mesures telles que les distributions, les corrélations, les distributions multivariées, les mesures de confidentialité, etc. De cette façon, vous pouvez facilement évaluer que les données synthétiques que nous fournissons sont de la plus haute qualité et peuvent être utilisées avec le même niveau de précision et de fiabilité que vos données originales.

Qu’évaluons-nous dans notre rapport d’assurance qualité ?

  • Précision
  • Confidentialité
  • Vitesse

Mesures de précision des données synthétiques

Capturer un aperçu : cette section illustre les points saillants de notre rapport synthétique sur la qualité des données. Nos évaluations examinent les données synthétiques par rapport aux données réelles dans diverses dimensions.

Distributions

Distributions de données synthétiques par rapport aux données réelles

Les distributions illustrent la fréquence des variables dans des catégories ou des valeurs données et sont capturées avec précision par le moteur Syntho.

Corrélations

Corrélations de données synthétiques par rapport aux données réelles

Les corrélations montrent la relation entre les variables, illustrant le degré de relation entre les variables. Le moteur Syntho capture avec précision ces relations.

Multivariable

Distributions multivariées de données synthétiques par rapport aux données réelles

Les distributions multivariées et les corrélations multivariées nous emmènent au-delà des dimensions singulières, en fournissant une vue complète de la manière dont plusieurs variables sont liées. Le Syntho Engine capture ces relations.

Avez-vous des questions?

Parlez à l'un de nos experts

Mesures synthétiques de confidentialité des données

Pourquoi les mesures synthétiques de confidentialité des données sont-elles pertinentes ?

La génération de données synthétiques est complexe et des pièges existent et doivent être contrôlés. Avec les algorithmes d’IA, le surajustement est un risque et c’est également le cas pour la génération de données synthétiques avec l’IA. Par conséquent, il convient de contrôler le risque de surajustement lors de la génération de données synthétiques. Le risque de surajustement est contrôlé dans le Syntho Engine. De plus, le rapport Syntho Quality Assurance (QA) permet aux organisations de démontrer que les données synthétiques ne sont pas surajustées par rapport aux données d'origine. Nous évaluons également sur des aspects plus liés à la confidentialité, qui sont souvent utilisés par les auditeurs internes.

Test sur des correspondances exactes

Test sur les « correspondances exactes » avec le ratio de correspondance identique (IMR)

Démonstration que le rapport entre les enregistrements de données synthétiques qui correspondent à un enregistrement réel par rapport aux données originales n'est pas significativement supérieur au rapport auquel on peut s'attendre lors de l'analyse des données du train.

Test sur des matchs similaires

Tester sur « Matchs similaires » avec la distance à l'enregistrement le plus proche (DCR)

Démonstration que la distance normalisée entre les enregistrements de données synthétiques et leur enregistrement réel le plus proche dans les données originales n'est pas significativement plus proche que la distance à laquelle on peut s'attendre lors de l'analyse des données du train.

Test sur les valeurs aberrantes

Tester sur « Valeurs aberrantes » avec le Rapport de distance du voisin le plus proche (NNDR)

Démonstration que le rapport de distance entre l'enregistrement synthétique le plus proche et le deuxième plus proche et leur enregistrement le plus proche dans les données d'origine n'est pas significativement plus proche que le rapport auquel on peut s'attendre pour les données de train.

Demander un rapport d'assurance qualité

Ceci n’est qu’un instantané qui résume l’essence de notre rapport d’exploration de la qualité des données synthétiques et d’assurance qualité. Il offre une compréhension nuancée des distributions, des corrélations et des distributions multivariées dans le cadre de données synthétiques capturées par les capacités avancées du moteur Syntho. Plus de détails sur notre rapport d’assurance qualité sont disponibles sur demande.

Documentation utilisateur

Demandez la documentation utilisateur de Syntho !