Untereinstellung

Reduzieren Sie Datensätze, um eine kleinere, repräsentative Teilmenge einer relationalen Datenbank zu erstellen und gleichzeitig die referenzielle Integrität aufrechtzuerhalten

Teilmengendiagramm

Einführung Teilmenge

Was ist Teilmenge?

Verringern Sie die Anzahl der Datensätze, um eine kleinere repräsentative Teilmenge einer relationalen Datenbank mit erhaltener referenzieller Integrität zu erstellen

Warum verwenden Organisationen Teilmengen?

Viele Unternehmen verfügen über Produktionsumgebungen mit riesigen Datenmengen und möchten keine riesigen Datenmengen in Testumgebungen außerhalb der Produktion haben. Daher wird die Datenbankteilmenge verwendet, um eine kleinere, repräsentative Teilmenge einer größeren relationalen Datenbank mit erhaltener referenzieller Integrität zu erstellen. Unternehmen nutzen Teilmengen für Testdaten, um Kosten zu senken, sie verwaltbar zu machen und die Einrichtung und Wartung zu beschleunigen.

Reduzieren Sie Infrastruktur- und Rechenkosten

Übermäßige Datenmengen können zu hohen Infrastruktur- und Rechenkosten führen, die für Testdaten in Nicht-Produktionsumgebungen unnötig sind. Mit Teilmengenfunktionen können Sie problemlos kleinere Teilmengen Ihrer Daten erstellen und so Ihre Kosten senken.

Überschaubare Testdaten durch Tester und Entwickler

Die Verwaltung riesiger Datenmengen in Nicht-Produktionsumgebungen stellt Tester und Entwickler vor Herausforderungen. Kleinere und dadurch überschaubarere Testdaten, deutliche Straffung der Test- und Entwicklungsprozesse und letztendlich eine Optimierung des gesamten Zyklus hinsichtlich Zeit und Ressourcen.

Schnellere Einrichtung und Wartung von Testdaten

Kleinere Datenmengen ermöglichen eine schnellere und einfachere Einrichtung und Wartung von Testumgebungen außerhalb der Produktion. Dies ist insbesondere in komplexen IT-Landschaften relevant und wenn häufige Änderungen in Datenstrukturen regelmäßige Aktualisierungen und Aktualisierungen erfordern, um die Repräsentativität der Testdaten sicherzustellen.

Teilmengendiagramm

Was ist referenzielle Integrität und warum ist sie wichtig?

Referenzielle Integrität ist ein Konzept in der Datenbankverwaltung, das Konsistenz und Genauigkeit zwischen Tabellen in einer relationalen Datenbank gewährleistet. Die referenzielle Integrität würde sicherstellen, dass jeder Wert, der „Person 1“ in „Tabelle 1“ entspricht, dem korrekten Wert von „Person 1“ in „Tabelle 2“ und jeder anderen verknüpften Tabelle entspricht.

Die Durchsetzung der referenziellen Integrität ist entscheidend für die Aufrechterhaltung der Zuverlässigkeit von Testdaten in einer relationalen Datenbank als Teil von Nicht-Produktionsumgebungen. Es verhindert Dateninkonsistenzen und stellt sicher, dass Beziehungen zwischen Tabellen für ordnungsgemäße Tests und Softwareentwicklung aussagekräftig und zuverlässig sind.

Testdaten in einer relationalen Datenbankumgebung sollten die referenzielle Integrität bewahren, um verwendbar zu sein. Die Aufrechterhaltung der referenziellen Integrität in Nicht-Produktionsumgebungen, wie sie zum Beispiel für Tests und Softwareentwicklung verwendet werden, ist aus mehreren Gründen wichtig:

Unterteilung, nicht so einfach wie „nur Daten löschen“

Unterteilungen sind nicht so einfach wie das einfache Löschen von Daten, da alle Downstream- und Upstream-bezogenen verknüpften Tabellen proportional untergeordnet werden sollten, um die referenzielle Integrität zu wahren. Die Teilmenge stellt sicher, dass nicht nur Daten in einer Zieltabelle gelöscht werden, sondern auch, dass alle Daten in allen anderen verknüpften Tabellen, die sich auf die gelöschten Daten aus der Zieltabelle beziehen, gelöscht werden. Dadurch wird sichergestellt, dass die referenzielle Integrität über Tabellen, Datenbanken und Systeme hinweg im Rahmen der Datenlöschung erhalten bleibt.

Reduzierung des Datenvolumens durch Entfernen von „Person X“ aus „Tisch Y“, Alle Datensätze, die sich auf „Person X“ in „Tabelle Y“ beziehen, sollten gelöscht werden, aber auch alle Datensätze, die sich auf „Person

Reduzierung des Datenvolumens durch Entfernen von „Richard“ aus der Tabelle „Kunden“., Alle Datensätze, die sich auf „Richard“ in der Tabelle „Kunde“ beziehen, sollten gelöscht werden, aber auch alle Datensätze, die sich auf „Richard“ in anderen vor- oder nachgelagerten zugehörigen Tabellen (Zahlungstabelle, Vorfalltabelle, Versicherungsschutztabelle usw.) beziehen, sollten ebenfalls gelöscht werden gelöscht.

Acros-Tabellen

Die Unterteilung funktioniert tabellenübergreifend

Acros-Datenbanken

Die Teilmenge funktioniert datenbankübergreifend

Acros-Systeme

Die Unterteilung funktioniert systemübergreifend

Sprechen Sie mit einem unserer Experten

Wie kann ich Untereinstellungen nutzen?

Proportionale Teilmenge

Sie können die Syntho Engine so konfigurieren, dass eine Teilmenge einer relationalen Datenbank erstellt wird und sichergestellt wird, dass alle „verknüpften Tabellen“ basierend auf der „Zieltabelle“ Teilmengen bilden.

  • Zieltabelle: Benutzer können die Zieltabelle als Ausgangspunkt für die Teilmenge definieren.
    • Benutzer können beispielsweise festlegen, dass die „Patiententabelle“ auf 5 % oder auf 500 Datensätze anstelle von 10.000 Datensätzen aufgeteilt wird.
  • Verlinkte Tabellen: Dies sind alles direkt oder indirekt mit der „Zieltabelle“ verbundene Tabellen. Verknüpfungen zwischen Tabellen können direkt sein, wie zum Beispiel eine Zieltabelle, die Allergien auflistet und über eine Fremdschlüsselbeziehung auf eine Patiententabelle verweist, oder indirekt, wie zum Beispiel eine Zieltabelle, die auf eine Patiententabelle verweist, die wiederum auf die Tabelle eines Krankenhauses verweist.
    • Durch die Unterteilung wird sichergestellt, dass alle Datensätze, die sich auf die gelöschten Daten beziehen, in der „Patiententabelle“ wird ebenfalls gelöscht. Im Beispiel stellt die Teilmenge sicher, dass in jeder „verknüpften Tabelle“ nur Daten vorhanden sind, die sich auf die 5 % (500 Datensätze) beziehen, und dass alle anderen Daten, die sich auf die 95 % (10.000 – 500 = 9.500 Datensätze) beziehen, gelöscht werden um eine kleinere repräsentative Teilmenge einer relationalen Datenbank mit erhaltener referenzieller Integrität zu erstellen

Unterteilung basierend auf Geschäftsregeln

Zusätzlich zur proportionalen Teilmenge, bei der Sie einen Prozentsatz für die Datenextraktion angeben, ermöglichen Ihnen unsere erweiterten Funktionen die genaue Definition der Zielgruppe für die Teilmenge. Sie können beispielsweise Kriterien angeben, um bestimmte Teilmengen einzuschließen oder auszuschließen, was für mehr Flexibilität und Kontrolle über den Datenextraktionsprozess sorgt

  • Kunden jünger als 60 Jahre und älter als 30 Jahre und
  • Als männliche Kunden
Verkaufskundentabelle

Syntho-Guide-Cover

Speichern Sie jetzt Ihren Leitfaden für synthetische Daten!