サブセット化

レコードを削減して、参照整合性を維持しながら、リレーショナル データベースのより小さく代表的なサブセットを作成します。

グラフのサブセット化

はじめに サブセット化

サブセット化とは何ですか?

レコード数を減らして、参照整合性を維持したリレーショナル データベースのより小さな代表的なサブセットを作成します。

組織がサブセット化を使用するのはなぜですか?

多くの組織は、大量のデータを含む実稼働環境を持っていますが、非実稼働テスト環境に大量のデータを置くことを望んでいません。したがって、データベースのサブセット化は、参照整合性が保たれた、より大きなリレーショナル データベースのより小さな代表的なサブセットを作成するために使用されます。組織はテスト データのサブ設定を利用してコストを削減し、データを管理しやすくし、セットアップとメンテナンスを迅速化します。

インフラストラクチャと計算コストを削減する

データ量が過剰になると、インフラストラクチャと計算コストが高くなる可能性がありますが、非運用環境でのテスト データには不要です。サブセット機能を使用すると、データの小さなサブセットを簡単に作成してコストを削減できます。

テスターと開発者が管理可能なテストデータ

非運用環境で膨大なデータを管理することは、テスターと開発者にとって課題となります。テストデータが小さくなり管理しやすくなり、テストと開発のプロセスが大幅に合理化され、最終的には時間とリソースの面でサイクル全体が最適化されます。

テストデータのセットアップとメンテナンスの迅速化

データ量が少ないと、非実稼働テスト環境のセットアップとメンテナンスがより迅速かつ簡単になります。これは、複雑な IT 環境や、データ構造が頻繁に変更され、テスト データの代表性を確保するために定期的な更新と更新が必要な場合に特に関係します。

グラフのサブセット化

参照整合性とは何ですか?なぜ重要ですか?

参照整合性は、リレーショナル データベース内のテーブル間の一貫性と正確性を保証するデータベース管理の概念です。参照整合性により、「表 1」の「人物 1」に対応するすべての値が、「表 1」および他のリンクされたテーブルの「人物 2」の正しい値に対応することが保証されます。

参照整合性の強制は、非運用環境の一部としてリレーショナル データベース内のテスト データの信頼性を維持するために重要です。これにより、データの不整合が防止され、テーブル間の関係が適切なテストとソフトウェア開発に意味があり、信頼できるものになることが保証されます。

リレーショナル データベース環境のテスト データは、参照整合性を維持して使用できるようにする必要があります。テストやソフトウェア開発に使用される環境など、非実稼働環境で参照整合性を維持することは、次のような理由から重要です。

サブセット化、「データを削除するだけ」というほど単純ではない

サブセット化は、単純にデータを削除するほど簡単ではありません。これは、参照整合性を維持するために、すべての下流および上流の関連リンク テーブルを比例的にサブセット化する必要があるためです。サブセット化により、ターゲット テーブル内のデータが削除されるだけでなく、ターゲット テーブルから削除されたデータに関連する他のリンク テーブル内のデータも確実に削除されます。これにより、データ削除の一環として、テーブル、データベース、システム全体の参照整合性が確実に保持されます。

「テーブル Y」から「人物 X」を削除してデータ量を削減する, 「テーブル Y」の「人物 X」に関連するすべてのレコードを削除する必要がありますが、他の上流または下流の関連テーブル (テーブル A、B、C など) の「人物 X」に関連するすべてのレコードも削除する必要があります。

「Customers」テーブルから「Richard」を削除してデータ量を削減する, 「顧客」テーブルの「リチャード」に関連するすべてのレコードを削除する必要がありますが、他の上流または下流の関連テーブル (支払いテーブル、インシデント テーブル、保険適用範囲テーブルなど) の「リチャード」に関連するすべてのレコードも削除する必要があります。削除されました。

アクロステーブル

サブセット化はテーブル全体で機能します

アクロスデータベース

サブセット化はデータベース全体で機能します

アクロスシステムズ

サブセット化はシステム全体で機能します

何か質問がありますか?

弊社の専門家にご相談ください

サブ設定を利用するにはどうすればよいですか?

比例サブセット化

Syntho エンジンを設定して、リレーショナル データベースをサブセット化し、すべての「リンク テーブル」が「ターゲット テーブル」に基づいてサブセット化されるようにすることができます。

  • ターゲットテーブル: ユーザーは、サブセット化の開始点としてターゲット テーブルを定義できます。
    • たとえば、ユーザーは「患者テーブル」のサブセットを 5% または 500k レコードではなく 10.000k レコードに定義できます。
  • リンクされたテーブル: これらはすべて、「ターゲット テーブル」に直接的または間接的に接続されているテーブルです。テーブル間のリンクは、外部キー関係を通じて患者テーブルを参照するアレルギーをリストするターゲット テーブルのように直接的な場合もあれば、患者テーブルを参照し、病院のテーブルを参照するターゲット テーブルのように間接的な場合もあります。
    • サブセット化により、削除されたデータに関連するすべてのレコードが 「患者テーブル」も削除されます。この例では、サブセット化により、「リンク テーブル」には 5% (500k レコード) に関連するデータのみが存在し、95% (10.000k – 500k = 9.500k レコード) に関連する他のデータはすべて削除されます。参照整合性を保持したリレーショナル データベースのより小さな代表的なサブセットを作成するため

ビジネスルールに基づいたサブセット化

データ抽出のパーセンテージを指定する比例サブセット化に加え、高度な機能を使用すると、サブセット化のターゲット グループを正確に定義できます。たとえば、特定のサブセットを含めたり除外したりする基準を指定できるため、データ抽出プロセスの柔軟性と制御が向上します。

  • 60歳未満および30歳以上のお客様
  • アルス男性のお客様
販売顧客テーブル

シンセガイドカバー

合成データガイドを今すぐ保存してください!