サブセット化

参照整合性を維持しながら、レコードを削減してリレーショナル データベースのより小さな代表的なサブセットを作成します。

デモを予約する
Syntho によるデータのサブセット化

使用の主な利点
サブセット化

参照整合性を維持しながら、より小さく代表的なデータセットを作成します。

インフラの削減
計算コスト

データ量が過剰になると、インフラストラクチャと計算コストが高くなる可能性がありますが、非運用環境でのテスト データには不要です。サブセット機能を使用すると、データの小さなサブセットを簡単に作成してコストを削減できます。

管理可能なテストデータ
テスターと開発者

非運用環境で膨大なデータを管理することは、テスターと開発者にとって課題となります。テストデータが小さくなり管理しやすくなり、テストと開発のプロセスが大幅に合理化され、最終的には時間とリソースの面でサイクル全体が最適化されます。

テストデータ管理を簡素化し、セットアップとメンテナンスを迅速化

データ量が少ないと、非実稼働テスト環境のセットアップとメンテナンスがより迅速かつ簡単になります。これは、複雑な IT 環境や、データ構造が頻繁に変更され、テスト データの代表性を確保するために定期的な更新と更新が必要な場合に特に関係します。

安全なテスト、開発、トレーニング環境を実現する

より小さく代表的なデータのサブセットを扱うことで、組織はテスト、開発、トレーニングのための安全な環境を確立できます。これにより、非本番環境のユースケースでデータの整合性と有用性を維持しながら、機密情報が漏洩するリスクを最小限に抑えることができます。

ユーザー資料

Synthoユーザードキュメントを見る

もっと詳しく

サブセット化 3の手順

3ステップでサブセット化
01
テーブル設定を構成する

サブセット化のためにテーブルを含めるか除外します。

02
生成する行を調整する

「生成する行」フィールドで行数を定義します。「合成」では AI を使用して行が作成され、「複製」ではソースから行のサンプルがコピーされ、「除外」では行の生成がスキップされます。調整によって外部キーの関係が影響を受ける可能性があることに注意してください。

製品デモ

サブセット化

データの量と多様性を高める合成データを作成する

近日公開: 高度なサブセット化機能

サブセット化はそれほど単純ではない
「データを削除するだけ」

サブセット化は、単にデータを削除するほど簡単ではありません。参照整合性を維持するために、下流および上流の関連するリンク テーブルすべてを比例してサブセット化する必要があります。

サブセット化により、ターゲット テーブル内のデータが削除されるだけでなく、ターゲット テーブルから削除されたデータに関連する他のリンク テーブル内のデータもすべて削除されます。

これにより、データ削除の一環として、テーブル、データベース、システム間の参照整合性が維持されます。

「テーブル Y」から「人物 X」を削除してデータ量を削減する、「テーブル Y」内の「人物 X」に関連するすべてのレコードを削除するだけでなく、他の上流または下流の関連テーブル(テーブル A、B、C など)内の「人物 X」に関連するすべてのレコードも削除する必要があります。

「顧客」から「リチャード」を削除してデータ量を削減する テーブルの場合、「顧客」テーブル内の「Richard」に関連するすべてのレコードを削除するだけでなく、他の上流または下流の関連テーブル(支払いテーブル、インシデントテーブル、保険適用範囲テーブルなど)内の「Richard」に関連するすべてのレコードも削除する必要があります。

テーブルをまたいで
テーブルをまたいで

サブセット化はテーブル全体で機能します

データベース内
データベース内

サブセット化はデータベース内で機能します

システム内
システム内

サブセット化はシステム内で機能する

比例サブセット化

近日発表

Syntho エンジンを設定して、リレーショナル データベースをサブセット化し、すべての「リンク テーブル」が「ターゲット テーブル」に基づいてサブセット化されるようにすることができます。

比例サブセット化
対象表
対象表
これらはすべて、「ターゲット テーブル」に直接的または間接的に接続されたテーブルです。テーブル間のリンクは、アレルギーをリストするターゲット テーブルが外部キー関係を通じて患者のテーブルを参照するなど直接的なものである場合もあれば、ターゲット テーブルが患者のテーブルを参照し、その患者テーブルが病院のテーブルを参照するなど間接的なものである場合もあります。
リンクされたテーブル
リンクされたテーブル
これらはすべて、「ターゲット テーブル」に直接的または間接的に接続されたテーブルです。テーブル間のリンクは、アレルギーをリストするターゲット テーブルが外部キー関係を通じて患者のテーブルを参照するなど直接的なものである場合もあれば、ターゲット テーブルが患者のテーブルを参照し、その患者テーブルが病院のテーブルを参照するなど間接的なものである場合もあります。

ビジネスルールに基づいたサブセット化

近日発表

データ抽出のパーセンテージを指定する比例サブセット化に加え、高度な機能を使用すると、サブセット化のターゲット グループを正確に定義できます。たとえば、特定のサブセットを含めたり除外したりする基準を指定できるため、データ抽出プロセスの柔軟性と制御が向上します。

  • 60歳未満および30歳以上のお客様
  • 男性客として
ビジネスルールに基づいたサブセット化

よくあるご質問

サブセット化とは何ですか?

多くの組織は、大量のデータを含む実稼働環境を持っていますが、非実稼働テスト環境に大量のデータを置くことを望んでいません。したがって、データベースのサブセット化は、参照整合性が保たれた、より大きなリレーショナル データベースのより小さな代表的なサブセットを作成するために使用されます。組織はテスト データのサブ設定を利用してコストを削減し、データを管理しやすくし、セットアップとメンテナンスを迅速化します。

参照整合性とは何ですか?なぜ重要ですか?

参照整合性は、リレーショナル データベース内のテーブル間の一貫性と正確性を保証するデータベース管理の概念です。参照整合性により、「表 1」の「人物 1」に対応するすべての値が、「表 1」および他のリンクされたテーブルの「人物 2」の正しい値に対応することが保証されます。

参照整合性の強制は、非運用環境の一部としてリレーショナル データベース内のテスト データの信頼性を維持するために重要です。これにより、データの不整合が防止され、テーブル間の関係が適切なテストとソフトウェア開発に意味があり、信頼できるものになることが保証されます。

リレーショナル データベース環境のテスト データは、使用可能にするために参照整合性を維持する必要があります。

建設 より良く、より速く 今日の合成データ

データ アクセスを解放し、開発を加速し、データのプライバシーを強化します。

ニュースレターに登録する

合成データの最新ニュースを常にチェック