Subsetarea

Reduceți înregistrările pentru a crea un subset mai mic și reprezentativ al unei baze de date relaționale, menținând în același timp integritatea referențială

grafic de subsetare

Introducere Subsetarea

Ce este subsetarea?

Reduceți numărul de înregistrări pentru a crea un subset reprezentativ mai mic al unei baze de date relaționale cu integritate referențială păstrată

De ce folosesc organizațiile subsetarea?

Multe organizații au medii de producție cu cantități masive de date și nu doresc cantități masive de date în medii de testare non-producție. Prin urmare, subsetarea bazei de date este utilizată pentru a crea un subset mai mic, reprezentativ al unei baze de date relaționale mai mari, cu integritate referențială păstrată. Organizațiile utilizează subsetări pentru datele de testare pentru a reduce costurile, pentru a le face ușor de gestionat și pentru o configurare și întreținere mai rapide.

Reduceți costurile de infrastructură și de calcul

Volumele excesive de date pot duce la costuri mari de infrastructură și de calcul, care nu sunt necesare pentru datele de testare în medii care nu sunt de producție. Cu capabilitățile de subsetare, puteți crea cu ușurință subseturi mai mici de date pentru a vă reduce costurile.

Date de testare gestionabile de testeri și dezvoltatori

Gestionarea unor volume uriașe de date în medii non-producție ridică provocări pentru testeri și dezvoltatori. Date de testare mai mici și, prin urmare, mai ușor de gestionat, simplificând semnificativ procesele de testare și dezvoltare, optimizând în cele din urmă întregul ciclu în termeni de timp și resurse.

Configurare și întreținere mai rapidă a datelor de testare

Volumele mai mici de date facilitează configurarea și întreținerea mai rapidă și mai simplă a mediilor de testare care nu sunt de producție. Acest lucru este deosebit de relevant în peisajele IT complexe și atunci când schimbările frecvente ale structurilor de date necesită actualizări și reîmprospătări regulate pentru a asigura reprezentativitatea datelor de testare.

grafic de subsetare

Ce este integritatea referenţială şi de ce este importantă?

Integritatea referenţială este un concept în managementul bazei de date care asigură consistenţa şi acurateţea între tabelele dintr-o bază de date relaţională. Integritatea referențială ar asigura că fiecare valoare care corespunde „Persoanei 1” din „Tabelul 1” corespunde valorii corecte a „Persoanei 1” din „Tabelul 2” și din orice alt tabel asociat.

Implementarea integrității referențiale este esențială pentru menținerea fiabilității datelor de testare într-o bază de date relațională ca parte a mediilor care nu sunt de producție. Previne inconsecvențele datelor și asigură că relațiile dintre tabele sunt semnificative și de încredere pentru testarea și dezvoltarea software-ului adecvate.

Datele de testare într-un mediu de baze de date relaționale ar trebui să păstreze integritatea referențială pentru a fi utilizabile. Menținerea integrității referențiale în mediile care nu sunt de producție, cum ar fi cele utilizate pentru testare și dezvoltare software, este importantă din mai multe motive:

Subsetare, nu atât de simplă ca „doar ștergerea datelor”

Subsetarea nu este la fel de ușoară ca simpla ștergere a datelor, deoarece toate tabelele legate în aval și în amonte ar trebui să fie subsetate proporțional pentru a păstra integritatea referențială. Subsetarea asigură că nu numai datele dintr-un tabel țintă sunt șterse, ci și că orice date din orice alt tabel legat legate de datele șterse din tabelul țintă sunt șterse. Acest lucru asigură păstrarea integrității referențiale între tabele, baze de date și sisteme ca parte a ștergerii datelor.

Reducerea volumului de date prin eliminarea „Persoana X” din „Tabelul Y”, toate înregistrările legate de „Persoana X” din „Tabelul Y” ar trebui șterse, dar și toate înregistrările legate de „Persoana X” din orice alt tabel asociat din amonte sau din aval (tabelul A, B, C etc.) ar trebui, de asemenea, șterse.

Reducerea volumului de date prin eliminarea „Richard” din tabelul „Clienți”., trebuie șterse toate înregistrările legate de „Richard” din tabelul „Client”, dar și toate înregistrările legate de „Richard” din orice alt tabel aferent din amonte sau din aval (tabel de plăți, tabel de incidente, tabel de acoperire a asigurărilor etc.) ar trebui, de asemenea, să fie șters.

Acro tabele

Subsetarea funcționează peste tabele

Acro baze de date

Subsetarea funcționează în bazele de date

Acros Systems

Subsetarea funcționează în toate sistemele

Aveti vreo intrebare?

Discutați cu unul dintre experții noștri

Cum pot utiliza subsetarea?

Subsetarea proporțională

Puteți configura Syntho Engine pentru a subseta o bază de date relațională și pentru a vă asigura că toate „tabelele legate” sunt subsetate pe baza „Tabelului țintă”.

  • Tabel țintă: Utilizatorii pot defini tabelul țintă ca punct de plecare pentru subsetare.
    • Utilizatorii pot defini, de exemplu, să subsete „Tabelul Pacienților” la 5% sau la 500k înregistrări în loc de 10.000k înregistrări.
  • Tabele legate: Acestea sunt toate tabele conectate direct sau indirect la „Tabelul țintă”. Legăturile dintre tabele pot fi directe, cum ar fi un tabel țintă care listează alergii care face referire la un tabel de pacienți printr-o relație de cheie străină, sau indirecte, cum ar fi un tabel țintă care face referire la un tabel de pacienți, care, la rândul său, face referire la tabelul unui spital.
    • Subsetarea asigură că toate înregistrările legate de datele șterse din „Tabelul pacientului” va fi, de asemenea, șters. În exemplu, subsetarea asigură că în orice „Tabel legat” există doar date care sunt legate de 5% (500k înregistrări) și că toate celelalte date legate de 95% (10.000k – 500k = 9.500k înregistrări) sunt șterse pentru a crea un subset reprezentativ mai mic al unei baze de date relaționale cu integritate referențială păstrată

Subsetarea bazată pe regulile de afaceri

Pe lângă subsetarea proporțională, în care specificați un procent pentru extragerea datelor, capabilitățile noastre avansate vă permit să definiți cu precizie grupul țintă pentru subsetare. De exemplu, puteți specifica criterii pentru a include sau a exclude anumite subseturi, oferind o mai mare flexibilitate și control asupra procesului de extragere a datelor

  • Clienții cu vârsta sub 60 de ani și peste 30 de ani și
  • Als clienți bărbați
tabelul clienților de vânzări

capac ghidaj syntho

Salvați ghidul de date sintetice acum!