Subset

Ngurangan rékaman pikeun nyieun sawaréh leutik, wakil tina database relational bari ngajaga integritas referential

grafik subsetting

Pendahuluan Subsetting

Naon subsetting?

Ngurangan jumlah rékaman pikeun nyieun sawaréh leutik wawakil database relational kalawan integritas rujukan dilestarikan

Naha organisasi ngagunakeun subsetting?

Seueur organisasi gaduh lingkungan produksi kalayan jumlah data anu ageung sareng henteu hoyong jumlah data anu ageung dina lingkungan tés non-produksi. Lantaran kitu, subsetting database dipaké pikeun nyieun subset leutik, representatif tina database relational nu leuwih gede jeung integritas rujukan dilestarikan. Organisasi ngagunakeun sub-setting pikeun data tés pikeun ngirangan biaya, supados tiasa diurus sareng pangaturan sareng pangropéa langkung gancang.

Ngurangan biaya infrastruktur sareng komputasi

Volume data anu kaleuleuwihan tiasa nyababkeun biaya infrastruktur sareng komputasi anu luhur, anu henteu diperyogikeun pikeun data tés dina lingkungan non-produksi. Kalayan kamampuan subset, anjeun tiasa sacara gampil nyiptakeun subset data anjeun pikeun ngirangan biaya anjeun.

Data uji anu tiasa diurus ku panguji sareng pamekar

Ngatur volume data anu ageung dina lingkungan non-produksi nyababkeun tantangan pikeun panguji sareng pamekar. Data tés anu langkung alit sareng langkung tiasa diurus, sacara signifikan nyepetkeun prosés tés sareng pamekaran, pamustunganana ngaoptimalkeun sadayana siklus dina hal waktos sareng sumber.

Pangaturan sareng pangropéa data tés langkung gancang

Jilid data anu langkung alit ngagampangkeun pangaturan sareng pangropéa anu langkung gancang sareng langkung lugas pikeun lingkungan tés non-produksi. Ieu hususna relevan dina bentang IT anu kompleks sareng nalika sering parobihan dina struktur data ngabutuhkeun apdet rutin sareng nyegerkeun pikeun mastikeun perwakilan data tés.

grafik subsetting

Naon integritas referensial sareng naha éta penting?

Integritas referensial mangrupikeun konsép dina manajemén database anu ngajamin konsistensi sareng akurasi antara tabel dina database relasional. Integritas rujukan bakal mastikeun yén unggal nilai nu pakait jeung "Jalma 1" tina "Table 1" pakait jeung nilai bener "jalma 1" dina "Table 2" na sagala tabel numbu séjén.

Enforcing integritas rujukan penting pisan pikeun ngajaga reliabilitas data tés dina database relational salaku bagian tina lingkungan non-produksi. Éta nyegah inconsistencies data sareng mastikeun yén hubungan antara tabel bermakna sareng dipercaya pikeun nguji sareng pamekaran parangkat lunak anu leres.

Data uji dina lingkungan database relasional kedah ngajaga integritas referensial janten tiasa dianggo. Ngajaga integritas rujukan dina lingkungan non-produksi, sapertos anu dianggo pikeun nguji sareng pamekaran parangkat lunak, penting kusabab sababaraha alesan:

Subset, henteu sasederhana "ngan mupus data"

Subsetting teu sagampang saukur mupus data, sabab sakabeh tabel numbu ka hilir jeung hulu kudu subsetting proporsional pikeun ngajaga integritas rujukan. Subsetting ensures yén teu ukur data dina tabel target dihapus, tapi ogé yén data dina sagala tabel numbu séjén patali jeung data dihapus tina tabel target dihapus. Ieu mastikeun yén integritas rujukan dina tabel, basis data sareng sistem dilestarikan salaku bagian tina ngahapus data.

Ngurangan volume data ku miceun "Jalma X" tina "Table Y", Sadaya rékaman anu aya hubunganana sareng "Jalma X" dina "Tabel Y" kedah dihapus, tapi ogé sadaya rékaman anu aya hubunganana sareng "Jalma X" dina tabel anu aya hubunganana sareng hulu atanapi hilir (tabél A, B, C sareng sajabana) ogé kedah dihapus.

Ngurangan volume data ku cara ngahapus "Richard" tina méja "Palanggan"., Sadaya rékaman anu aya hubunganana sareng "Richard" dina tabel "Palanggan" kedah dipupus, tapi ogé sadaya rékaman anu aya hubunganana sareng "Richard" dina méja anu aya hubunganana sareng hulu atanapi hilir (méja pamayaran, méja Kajadian, Asuransi Coverage Table jsb.) dipupus.

Méja Acros

Subsetting jalan sakuliah tabel

databases Acros

Subsetting jalan sakuliah database

Sistem Acros

Subsetting jalan sakuliah sistem

Ulah anjeun mibanda patalékan?

Ngobrol jeung salah sahiji ahli urang

Kumaha carana abdi tiasa ngagunakeun sub-setting?

Subset proporsional

Anjeun tiasa ngonpigurasikeun Mesin Syntho ka subset database relational sarta pikeun mastikeun yén sakabéh "tabél numbu" subsetted dumasar kana "Target Table".

  • Méja target: Pamaké bisa nangtukeun tabel target salaku titik awal pikeun subsetting.
    • Pamaké tiasa, contona, nangtukeun subset "Table Patient" ka 5% atanapi ka 500k rékaman tinimbang 10.000k rékaman.
  • tabél numbu: Ieu kabeh langsung atanapi henteu langsung disambungkeun tabel ka "Target Table". Tautan antara tabel tiasa langsung, sapertos tabel target daptar alergi anu ngarujuk kana méja pasien ngalangkungan hubungan konci asing, atanapi henteu langsung, sapertos tabel target anu ngarujuk kana méja pasien, anu ogé ngarujuk kana méja rumah sakit.
    • Subsetting mastikeun yén sadaya rékaman anu aya hubunganana sareng data anu dihapus dina file "Table Patient" ogé bakal dihapus. Dina conto, subsetting ensures yén dina sagala "Tabel numbu" aya ngan data nu patali jeung 5% (500k rekor) sarta yén sakabéh data sejenna nu patali jeung 95% (10.000k - 500k = 9.500k rékaman) dihapus. pikeun nyieun subset wawakil leutik tina database relational kalawan integritas rujukan dilestarikan

Subset dumasar kana aturan bisnis

Salian subset proporsional, dimana anjeun nangtukeun persentase pikeun ékstraksi data, kamampuhan canggih kami ngidinan Anjeun pikeun persis nangtukeun grup target pikeun subsetting. Salaku conto, anjeun tiasa netepkeun kritéria pikeun ngalebetkeun atanapi ngaluarkeun subkumpulan khusus, nyayogikeun kalenturan sareng kontrol anu langkung ageung kana prosés ékstraksi data.

  • Konsumén ngora ti 60 taun sarta heubeul ti 30 taun sarta
  • konsumén Als Jalu
méja konsumén jualan

panutup pituduh syntho

Simpen pituduh data sintétik anjeun ayeuna!