子集化

減少記錄以建立關係資料庫的較小的、有代表性的子集,同時保持引用完整性

子集圖

簡介 子集化

什麼是子集化?

減少記錄數量以建立關聯式資料庫的較小代表性子集並保留參考完整性

為什麼組織要使用子集化?

許多組織擁有包含大量資料的生產環境,且不希望在非生產測試環境中存在大量資料。因此,資料庫子集用於建立較大關係資料庫的較小的、有代表性的子集,並保留參考完整性。組織利用測試資料的子設定來降低成本、使其易於管理並加快設定和維護速度。

降低基礎設施和運算成本

過多的資料量可能會導致高昂的基礎設施和運算成本,而這對於非生產環境中的測試資料來說是不必要的。借助子集功能,您可以輕鬆建立更小的資料子集以降低成本。

測試人員和開發人員可管理測試數據

在非生產環境中管理大量數據給測試人員和開發人員帶來了挑戰。測試資料較小,因此更易於管理,顯著簡化測試和開發流程,最終在時間和資源方面優化整個週期。

更快的測試資料設定和維護

較小的資料量有助於更快、更直接地設定和維護非生產測試環境。這在複雜的 IT 環境中以及當資料結構頻繁變化需要定期更新和刷新以確保測試資料的代表性時尤其重要。

子集圖

什麼是參照完整性以及為什麼它很重要?

引用完整性是資料庫管理中的一個概念,可確保關係資料庫中表格之間的一致性和準確性。引用完整性將確保與「表 1」的「人員 1」相對應的每個值都對應於「表 1」和任何其他連結表中「人員 2」的正確值。

強制引用完整性對於維護作為非生產環境一部分的關係資料庫中測試資料的可靠性至關重要。它可以防止數據不一致,並確保表之間的關係對於正確的測試和軟體開發來說是有意義且可靠的。

關係資料庫環境中的測試資料應保留引用完整性以使其可用。在非生產環境(例如用於測試和軟體開發的環境)中維護引用完整性非常重要,原因如下:

子集化,不只是「刪除資料」那麼簡單

子集化並不像簡單地刪除資料那麼容易,因為所有下游和上游相關的連結表都應該按比例子集化以保持引用完整性。子集化確保不僅刪除目標表中的數據,而且刪除與目標表中已刪除資料相關的任何其他連結表中的任何資料。這可確保在資料刪除過程中保留跨表、資料庫和系統的參考完整性。

從「表 Y」中刪除「人員 X」來減少資料量, 應刪除「Y 表」中與「人員 X」相關的所有記錄,並且還應刪除任何其他上游或下游相關表(表 A、B、C 等)中與「人員 X」相關的所有記錄。

透過從「客戶」表中刪除「理查德」來減少資料量, 「客戶」表中與「Richard」相關的所有記錄都應刪除,且任何其他上游或下游相關表(付款表、事故表、保險範圍表等)中與「Richard」相關的所有記錄也應刪除已刪除。

雜項表

跨表進行子集化工作

Acros資料庫

跨資料庫進行子集化工作

阿克羅斯系統公司

跨系統進行子集化工作

你有任何問題嗎?

與我們的一位專家交談

如何使用子設定?

比例子集化

您可以設定 Syntho 引擎來對關聯式資料庫進行子集化,並確保所有「連結表」都基於「目標表」進行子集化。

  • 目標表: 使用者可以將目標表定義為子集化的起點。
    • 例如,使用者可以定義將「患者表」子集設定為 5% 或 500k 筆記錄,而不是 10.000k 筆記錄。
  • 連結表: 這些都是直接或間接連接到「目標表」的表。表之間的連結可以是直接的,例如列出過敏的目標表透過外鍵關係引用患者表,也可以是間接的,例如引用患者表的目標表,而患者表又引用醫院的表。
    • 子集化確保與已刪除資料相關的所有記錄 「患者表」也將刪除。在範例中,子集化確保在任何「連結表」中僅存在與 5%(500k 記錄)相關的數據,並且刪除與 95%(10.000k – 500k = 9.500k 記錄)相關的所有其他資料建立關係資料庫的較小代表性子集,並保留引用完整性

基於業務規則的子集

除了按比範例集化(您可以指定資料提取的百分比)之外,我們的進階功能還允許您精確定義子集化的目標群組。例如,您可以指定標準來包含或排除特定子集,從而提供更大的靈活性和對資料提取過程的控制

  • 60歲以下、30歲以上的顧客
  • 還有男性顧客
銷售客戶表

合成器指南蓋

立即保存您的合成數據指南!