Subinstelling

Records verkleinen om een ​​kleinere, representatieve subset van een relationele database te creëren, terwijl de referentiële integriteit behouden blijft

Demo Aanvragen
subsetdata met Syntho

Belangrijkste voordelen van het gebruik
onderverdeling

Maak kleinere, representatieve datasets en behoud tegelijkertijd de referentiële integriteit.

Verminder infrastructuur
en rekenkosten

Overmatige datavolumes kunnen leiden tot hoge infrastructuur- en rekenkosten, die niet nodig zijn voor testdata in niet-productieomgevingen. Met de mogelijkheden voor subsets kunt u eenvoudig kleinere subsets van uw data maken om uw kosten te verlagen.

Beheersbare testdata door
testers en ontwikkelaars

Het beheren van enorme datavolumes in niet-productieomgevingen brengt uitdagingen met zich mee voor testers en ontwikkelaars. Kleinere en daardoor beter beheersbare testdata, waardoor test- en ontwikkelingsprocessen aanzienlijk worden gestroomlijnd en uiteindelijk de hele cyclus wordt geoptimaliseerd in termen van tijd en middelen.

Vereenvoudig het beheer van testdata voor snellere installatie en onderhoud

Kleinere datavolumes maken een snellere en eenvoudigere installatie en onderhoud van niet-productietestomgevingen mogelijk. Dit is met name relevant in complexe IT-landschappen en wanneer frequente veranderingen in datastructuren regelmatige updates en vernieuwingen vereisen om de representativiteit van testdata te garanderen.

Zorg voor veilige test-, ontwikkelings- en trainingsomgevingen

Door te werken met kleinere, representatieve subsets van data, kunnen organisaties veilige omgevingen creëren voor testen, ontwikkeling en training. Dit minimaliseert het risico op het blootstellen van gevoelige informatie, terwijl de data-integriteit en bruikbaarheid voor niet-productieve use cases behouden blijven.

Gebruikersdocumentatie

Verken de Syntho-gebruikersdocumentatie

Meer weten?

Subsetstappen

Subsetten in 3 stappen
01
Tabelinstellingen configureren

Tabellen voor subsets opnemen of uitsluiten.

02
Rijen aanpassen om te genereren

Definieer het aantal rijen in het veld Te genereren rijen, waarbij Synthesize rijen maakt met behulp van AI, Rijen van steekproeven uit de bron dupliceert en Rijen genereren overslaat uitsluit. Houd er rekening mee dat aanpassingen van invloed kunnen zijn op relaties tussen externe sleutels.

product demo

Subinstelling

Creëer synthetische data die het volume en de diversiteit van uw data vergroot

Binnenkort beschikbaar: geavanceerde subsetfuncties

Subsetten is niet zo eenvoudig als
“gewoon data wissen”

Subsetten is niet zo eenvoudig als het simpelweg verwijderen van data, omdat alle downstream en upstream gerelateerde gekoppelde tabellen proportioneel moeten worden gesubset om de referentiële integriteit te behouden.

Met subsetting wordt ervoor gezorgd dat niet alleen data in een doeltabel worden verwijderd, maar ook dat alle data in andere gekoppelde tabellen die gerelateerd zijn aan de verwijderde data uit de doeltabel, worden verwijderd.

Hiermee wordt gewaarborgd dat de referentiële integriteit tussen tabellen, databases en systemen behouden blijft tijdens het verwijderen van data.

Het datavolume verkleinen door “Persoon X” uit “Tabel Y” te verwijderen, alle records gerelateerd aan “Persoon X” in “Tabel Y” moeten worden verwijderd, maar ook alle records gerelateerd aan “Persoon X” in een andere upstream of downstream gerelateerde tabel (tabel A, B, C etc.) moeten ook worden verwijderd.

Verminderen van het datavolume door “Richard” te verwijderen uit de “Klanten” tabel, alle records gerelateerd aan “Richard” in de tabel “Klant” moeten worden verwijderd, maar ook alle records gerelateerd aan “Richard” in een andere upstream of downstream gerelateerde tabel (Betalingstabel, Incidententabel, Verzekeringsdekkingstabel etc.) moeten ook worden verwijderd.

Over tafels heen
Over tafels heen

Subsetting werkt over meerdere tabellen heen

Binnen databases
Binnen databases

Subsetten werkt binnen databases

Binnen systemen
Binnen systemen

Subsetten werken binnen systemen

Proportionele subsetting

Binnenkort beschikbaar

U kunt de Syntho Engine configureren om een ​​relationele database in te delen en ervoor te zorgen dat alle “gekoppelde tabellen” zijn onderverdeeld op basis van de “Doeltabel”.

Proportionele subsetting
Doeltabel
Doeltabel
Dit zijn allemaal tabellen die direct of indirect verbonden zijn met de "Doeltabel". Koppelingen tussen tabellen kunnen direct zijn, zoals een doeltabel met allergieën die verwijst naar de tabel van een patiënt via een vreemde sleutelrelatie, of indirect, zoals een doeltabel die verwijst naar de tabel van een patiënt, die op zijn beurt verwijst naar de tabel van een ziekenhuis.
Gekoppelde tabellen
Gekoppelde tabellen
Dit zijn allemaal tabellen die direct of indirect verbonden zijn met de "Doeltabel". Koppelingen tussen tabellen kunnen direct zijn, zoals een doeltabel met allergieën die verwijst naar de tabel van een patiënt via een vreemde sleutelrelatie, of indirect, zoals een doeltabel die verwijst naar de tabel van een patiënt, die op zijn beurt verwijst naar de tabel van een ziekenhuis.

Subsetting op basis van bedrijfsregels

Binnenkort beschikbaar

Naast proportionele subsetting, waarbij u een percentage opgeeft voor data-extractie, kunt u met onze geavanceerde mogelijkheden de doelgroep voor subsetting nauwkeurig definiëren. U kunt bijvoorbeeld criteria opgeven om specifieke subsets op te nemen of uit te sluiten, waardoor u meer flexibiliteit en controle over het dataextractieproces krijgt

  • Klanten jonger dan 60 jaar en ouder dan 30 jaar en
  • Als mannelijke klanten
Subsetting op basis van bedrijfsregels

Veelgestelde Vragen / FAQ

Wat is subsetten?

Veel organisaties hebben productieomgevingen met enorme hoeveelheden data en willen geen enorme hoeveelheden data in niet-productietestomgevingen. Daarom wordt database-subsetting gebruikt om een ​​kleinere, representatieve subset van een grotere relationele database te creëren met behoud van referentiële integriteit. Organisaties maken gebruik van subsettings voor testdata om de kosten te verlagen, beheersbaar te maken en voor snellere installatie en onderhoud.

Wat is referentiële integriteit en waarom is het belangrijk?

Referentiële integriteit is een concept in databasebeheer dat consistentie en nauwkeurigheid tussen tabellen in een relationele database garandeert. Referentiële integriteit zou ervoor zorgen dat elke waarde die overeenkomt met “Persoon 1” van “Tabel 1” overeenkomt met de juiste waarde van “persoon 1” in “Tabel 2” en elke andere gekoppelde tabel.

Het afdwingen van referentiële integriteit is cruciaal voor het handhaven van de betrouwbaarheid van testdata in een relationele database als onderdeel van niet-productieomgevingen. Het voorkomt inconsistenties in de data en zorgt ervoor dat de relaties tussen tabellen betekenisvol en betrouwbaar zijn voor een goede test- en softwareontwikkeling.

Testdata in een relationele databaseomgeving moeten de referentiële integriteit behouden om bruikbaar te zijn.

Bouw beter en sneller met synthetische data vandaag

Ontgrendel datatoegang, versnel de ontwikkeling en verbeter de dataprivacy.

Schrijf je in op onze nieuwsbrief

Blijf op de hoogte van het laatste nieuws over synthetische data