Synthos Qualitätssicherungsbericht

Bewerten Sie generierte synthetische Daten hinsichtlich Genauigkeit, Datenschutz und Geschwindigkeit

Synthos Qualitätssicherungsbericht

Einführungsbericht zur Qualitätssicherung

Was ist ein Qualitätssicherungsbericht?

Der Qualitätssicherungsbericht von Syntho bewertet die generierten synthetischen Daten und zeigt die Genauigkeit, den Datenschutz und die Geschwindigkeit der synthetischen Daten im Vergleich zu den Originaldaten.

Warum stellen wir für jeden generierten synthetischen Datensatz einen Qualitätssicherungsbericht zur Verfügung?

Bei Syntho wissen wir, wie wichtig zuverlässige und genaue synthetische Daten sind. Aus diesem Grund stellen wir für jeden synthetischen Datenlauf einen umfassenden Qualitätssicherungsbericht zur Verfügung. Unser Qualitätsbericht umfasst verschiedene Metriken wie Verteilungen, Korrelationen, multivariate Verteilungen, Datenschutzmetriken und mehr. Auf diese Weise können Sie leicht beurteilen, dass die von uns bereitgestellten synthetischen Daten von höchster Qualität sind und mit dem gleichen Maß an Genauigkeit und Zuverlässigkeit wie Ihre Originaldaten verwendet werden können.

Was beurteilen wir in unserem Qualitätssicherungsbericht?

  • Genauigkeit
  • Datenschutz
  • Schnelligkeit

Genauigkeitsmetriken für synthetische Daten

Einen Einblick gewinnen: In diesem Abschnitt werden Highlights aus unserem Bericht zur Qualität synthetischer Daten dargestellt. Unsere Bewertungen untersuchen die synthetischen Daten im Vergleich zu den realen Daten in verschiedenen Dimensionen.

Distributionen

Synthetische Datenverteilungen im Vergleich zu realen Daten

Verteilungen veranschaulichen die Häufigkeit von Variablen innerhalb bestimmter Kategorien oder Werte und werden von der Syntho Engine genau erfasst.

Korrelationen

Synthetische Datenkorrelationen im Vergleich zu realen Daten

Korrelationen zeigen die Beziehung zwischen Variablen und veranschaulichen den Grad der Beziehung zwischen Variablen. Die Syntho Engine erfasst diese Beziehungen genau.

Multivariate

Multivariate Verteilungen synthetischer Daten im Vergleich zu realen Daten

Multivariate Verteilungen und multivariate Korrelationen führen uns über einzelne Dimensionen hinaus und bieten einen umfassenden Überblick darüber, wie mehrere Variablen zusammenhängen. Die Syntho Engine erfasst diese Beziehungen.

Sprechen Sie mit einem unserer Experten

Synthetische Datenschutzmetriken

Warum sind synthetische Datenschutzmetriken relevant?

Die Generierung synthetischer Daten ist komplex und es gibt Fallstricke, die kontrolliert werden müssen. Bei KI-Algorithmen besteht die Gefahr einer Überanpassung, und das gilt auch für die synthetische Datengenerierung mit KI. Daher sollte bei der Generierung synthetischer Daten das Risiko einer Überanpassung berücksichtigt werden. Das Risiko einer Überanpassung wird in der Syntho Engine kontrolliert. Darüber hinaus ermöglicht der Syntho-Qualitätssicherungsbericht (QA) Unternehmen den Nachweis, dass die synthetischen Daten nicht zu sehr mit den Originaldaten übereinstimmten. Wir bewerten auch weitere datenschutzbezogene Aspekte, die häufig von internen Prüfern herangezogen werden.

Testen Sie auf exakte Übereinstimmungen

Test auf „Exakte Übereinstimmungen“ mit dem Identical Match Ratio (IMR)

Nachweis, dass das Verhältnis der synthetischen Datensätze, die zu einem realen Datensatz aus den Originaldaten passen, nicht wesentlich größer ist als das Verhältnis, das bei der Analyse der Zugdaten zu erwarten ist.

Testen Sie auf ähnliche Übereinstimmungen

Test auf „Ähnliche Übereinstimmungen“ mit der Distanz zum nächstgelegenen Datensatz (DCR)

Nachweis, dass der normalisierte Abstand für synthetische Datensätze zu ihrem nächstgelegenen tatsächlichen Datensatz innerhalb der Originaldaten nicht wesentlich näher ist als der Abstand, der bei der Analyse der Zugdaten erwartet werden kann.

Test auf Ausreißer

Test auf „Ausreißer“ mit dem Entfernungsverhältnis zum nächsten Nachbarn (NNDR)

Nachweis, dass das Abstandsverhältnis zwischen dem nächstgelegenen und dem zweitnächsten synthetischen Datensatz zu seinem nächstgelegenen Datensatz innerhalb der Originaldaten nicht wesentlich näher ist als das Verhältnis, das für die Zugdaten zu erwarten ist.

Fordern Sie einen Qualitätssicherungsbericht an

Dies ist nur eine Momentaufnahme, die das Wesentliche unseres Berichts zur Untersuchung der Qualität synthetischer Daten und zur Qualitätssicherung zusammenfasst. Es bietet ein differenziertes Verständnis von Verteilungen, Korrelationen und multivariaten Verteilungen als Teil synthetischer Daten, wie sie von den erweiterten Funktionen der Syntho Engine erfasst werden. Weitere Einzelheiten zu unserem Qualitätssicherungsbericht erhalten Sie auf Anfrage.

Benutzerdokumentation

Fordern Sie die Benutzerdokumentation von Syntho an!