Le rapport d'assurance qualité de Syntho évalue les données synthétiques générées et démontre l'exactitude, la confidentialité et la rapidité des données synthétiques par rapport aux données originales.
Chez Syntho, nous comprenons l'importance de données synthétiques fiables et précises. C'est pourquoi nous fournissons un rapport d'assurance qualité complet pour chaque exécution de données synthétiques. Notre rapport de qualité comprend diverses mesures telles que les distributions, les corrélations, les distributions multivariées, les mesures de confidentialité, etc. De cette façon, vous pouvez facilement évaluer que les données synthétiques que nous fournissons sont de la plus haute qualité et peuvent être utilisées avec le même niveau de précision et de fiabilité que vos données originales.
Capturer un aperçu : cette section illustre les points saillants de notre rapport synthétique sur la qualité des données. Nos évaluations examinent les données synthétiques par rapport aux données réelles dans diverses dimensions.
Distributions multivariées de données synthétiques par rapport aux données réelles
Les distributions multivariées et les corrélations multivariées nous emmènent au-delà des dimensions singulières, en fournissant une vue complète de la manière dont plusieurs variables sont liées. Le Syntho Engine capture ces relations.
La génération de données synthétiques est complexe et des pièges existent et doivent être contrôlés. Avec les algorithmes d’IA, le surajustement est un risque et c’est également le cas pour la génération de données synthétiques avec l’IA. Par conséquent, il convient de contrôler le risque de surajustement lors de la génération de données synthétiques. Le risque de surajustement est contrôlé dans le Syntho Engine. De plus, le rapport Syntho Quality Assurance (QA) permet aux organisations de démontrer que les données synthétiques ne sont pas surajustées par rapport aux données d'origine. Nous évaluons également sur des aspects plus liés à la confidentialité, qui sont souvent utilisés par les auditeurs internes.
Test sur les « correspondances exactes » avec le ratio de correspondance identique (IMR)
Démonstration que le rapport entre les enregistrements de données synthétiques qui correspondent à un enregistrement réel par rapport aux données originales n'est pas significativement supérieur au rapport auquel on peut s'attendre lors de l'analyse des données du train.
Tester sur « Matchs similaires » avec la distance à l'enregistrement le plus proche (DCR)
Démonstration que la distance normalisée entre les enregistrements de données synthétiques et leur enregistrement réel le plus proche dans les données originales n'est pas significativement plus proche que la distance à laquelle on peut s'attendre lors de l'analyse des données du train.
Tester sur « Valeurs aberrantes » avec le Rapport de distance du voisin le plus proche (NNDR)
Démonstration que le rapport de distance entre l'enregistrement synthétique le plus proche et le deuxième plus proche et leur enregistrement le plus proche dans les données d'origine n'est pas significativement plus proche que le rapport auquel on peut s'attendre pour les données de train.
Ceci n’est qu’un instantané qui résume l’essence de notre rapport d’exploration de la qualité des données synthétiques et d’assurance qualité. Il offre une compréhension nuancée des distributions, des corrélations et des distributions multivariées dans le cadre de données synthétiques capturées par les capacités avancées du moteur Syntho. Plus de détails sur notre rapport d’assurance qualité sont disponibles sur demande.