Underindstilling

Reducer registreringer for at skabe et mindre, repræsentativt undersæt af en relationel database, samtidig med at referentiel integritet bevares

underindstillingsgraf

Introduktion Underindstilling

Hvad er subsetting?

Reducer antallet af poster for at oprette en mindre repræsentativ delmængde af en relationsdatabase med bevaret referenceintegritet

Hvorfor bruger organisationer underindstilling?

Mange organisationer har produktionsmiljøer med enorme mængder data og ønsker ikke massive mængder data i ikke-produktionstestmiljøer. Derfor bruges databaseunderindstilling til at skabe et mindre, repræsentativt undersæt af en større relationel database med bevaret referentiel integritet. Organisationer bruger underindstillinger for testdata for at reducere omkostningerne, gøre dem håndterbare og for hurtigere opsætning og vedligeholdelse.

Reducer infrastruktur- og beregningsomkostninger

For store datamængder kan føre til høje infrastruktur- og beregningsomkostninger, som er unødvendige for testdata i ikke-produktionsmiljøer. Med underindstillingsmuligheder kan du nemt oprette mindre undersæt af dine data for at reducere dine omkostninger.

Håndterbare testdata af testere og udviklere

Håndtering af enorme datamængder i ikke-produktionsmiljøer udgør udfordringer for testere og udviklere. Mindre og derved mere håndterbare testdata, der markant strømliner test- og udviklingsprocesser, og i sidste ende optimerer hele cyklussen med hensyn til tid og ressourcer.

Hurtigere opsætning og vedligeholdelse af testdata

Mindre datamængder letter hurtigere og mere ligetil opsætning og vedligeholdelse af ikke-produktionstestmiljøer. Dette er især relevant i komplekse it-landskaber, og når hyppige ændringer i datastrukturer kræver regelmæssige opdateringer og opdateringer for at sikre repræsentativiteten af ​​testdata.

underindstillingsgraf

Hvad er referentiel integritet, og hvorfor er det vigtigt?

Referenceintegritet er et koncept inden for databasestyring, der sikrer konsistens og nøjagtighed mellem tabeller i en relationsdatabase. Referenceintegritet vil sikre, at hver værdi, der svarer til "Person 1" i "Tabel 1" svarer til den korrekte værdi af "person 1" i "Tabel 2" og enhver anden linket tabel.

Håndhævelse af referenceintegritet er afgørende for at opretholde pålideligheden af ​​testdata i en relationel database som en del af ikke-produktionsmiljøer. Det forhindrer datainkonsistens og sikrer, at relationer mellem tabeller er meningsfulde og pålidelige til korrekt test og softwareudvikling.

Testdata i et relationelt databasemiljø bør bevare referenceintegriteten for at kunne bruges. Opretholdelse af referenceintegritet i ikke-produktionsmiljøer, såsom dem, der bruges til test og softwareudvikling, er vigtigt af flere årsager:

Underindstilling, ikke så simpelt som "bare at slette data"

Underindstilling er ikke så let som blot at slette data, da alle nedstrøms- og opstrømsrelaterede linkede tabeller bør underindstilles proportionalt for at bevare referenceintegriteten. Underindstilling sikrer, at ikke kun data i en måltabel slettes, men også at alle data i enhver anden linket tabel, der er relateret til de slettede data fra måltabellen, slettes. Dette sikrer, at referenceintegritet på tværs af tabeller, databaser og systemer bevares som en del af datasletningen.

Reduktion af datavolumen ved at fjerne "Person X" fra "Tabel Y", alle poster relateret til "Person X" i "Tabel Y" bør slettes, men også alle poster relateret til "Person X" i enhver anden opstrøms- eller nedstrømsrelateret tabel (tabel A, B, C osv.) bør også slettes.

Reduktion af datamængden ved at fjerne "Richard" fra "Kunder"-tabellen, alle poster relateret til "Richard" i "Kunde"-tabellen skal slettes, men også alle poster relateret til "Richard" i enhver anden upstream- eller downstream-relateret tabel (betalingstabel, hændelsestabel, forsikringsdækningstabel osv.) bør også være slettet.

Acros tabeller

Underindstilling fungerer på tværs af tabeller

Acros databaser

Underindstilling fungerer på tværs af databaser

Acros Systems

Subsetting fungerer på tværs af systemer

Har du nogen spørgsmål?

Tal med en af ​​vores eksperter

Hvordan kan jeg bruge underindstilling?

Proportional underindstilling

Du kan konfigurere Syntho Engine til at undersætte en relationsdatabase og sikre, at alle "linkede tabeller" er underopdelt baseret på "Target Table".

  • Måltabel: Brugere kan definere måltabellen som udgangspunkt for underindstilling.
    • Brugere kan for eksempel definere at undersætte "Patienttabellen" til 5 % eller til 500 poster i stedet for 10.000.
  • Sammenkædede tabeller: Disse er alle direkte eller indirekte forbundne tabeller til "Måltabellen". Links mellem tabeller kan være direkte, såsom en måltabel med allergier, der refererer til en patienttabel gennem en fremmednøglerelation, eller indirekte, såsom en måltabel, der refererer til en patienttabel, som igen refererer til et hospitals tabel.
    • Underindstilling sikrer, at alle poster relateret til de slettede data i "Patienttabel" vil også blive slettet. I eksemplet sikrer underindstilling, at der i enhver "Linket tabel" kun er data, der er relateret til de 5% (500 optagelser), og at alle andre data relateret til de 95% (10.000k - 500k = 9.500k poster) slettes at skabe en mindre repræsentativ delmængde af en relationel database med bevaret referentiel integritet

Underindstilling baseret på forretningsregler

Ud over proportional subsetting, hvor du angiver en procentdel for dataudtræk, giver vores avancerede muligheder dig mulighed for præcist at definere målgruppen for subsetting. For eksempel kan du specificere kriterier for at inkludere eller udelukke specifikke undersæt, hvilket giver større fleksibilitet og kontrol over dataudtræksprocessen

  • Kunder yngre end 60 år og ældre end 30 år og
  • Als Mandlige kunder
salgskundebord

syntho guide cover

Gem din guide til syntetiske data nu!