使用の主な利点
ルールベースの合成データ
特定のルールや制約に合わせてカスタマイズされた高品質の合成データを生成します
データを生成する
スクラッチ
データが限られている場合、またはデータがまったくない場合、新しい機能を開発するときに代表的なデータの必要性が非常に重要になります。ルールベースの合成データにより、データを最初から生成でき、テスターと開発者に重要なテスト データが提供されます。
データを充実させる
ルールベースの合成データは、拡張された行や列を生成することでデータを強化できます。これを使用して追加の行を生成し、より大きなデータセットを簡単かつ効率的に作成できます。さらに、ルール ベースの合成データを使用してデータを拡張し、既存の列に依存する可能性がある追加の新しい列を生成することができます。
柔軟性とカスタマイズ
ルールベースのアプローチは、多様なデータ形式と構造に適応する柔軟性とカスタマイズを提供し、特定のニーズに応じて合成データを完全にカスタマイズできるようにします。さまざまなシナリオをシミュレートするルールを設計できるため、データを生成するための柔軟な方法になります。
ユーザー資料
Synthoユーザードキュメントを見る
ルールベースの合成データがより先進的である理由
生成できる合成データの例
計算列関数:
データのクリーニングと変換
空白のトリミング、テキストの大文字と小文字の変更、日付形式の変換など、データのクリーンアップや再フォーマットが簡単に行えます。
統計計算
論理式、数学式、または条件式を使用して行レベルの計算を実行し、詳細なレベルでデータを変換します。
論理演算
データに論理テストを適用して、フラグやインジケーターを作成したり、特定の基準に基づいてデータをフィルターおよび分類したりできます。
数学演算
調整、スケーリング、丸めのための数式の適用など、行レベルの数学的変換を実行します。
テキストと日付の操作
日付またはテキスト フィールドの一部をトリミング、書式設定、抽出するなどの機能を使用して、テキスト フィールドと日付フィールドを変換します。
データシミュレーション
定義済みのモッカーを使用してデータを生成し、均一分布や正規分布などの特定の分布を適用することでカスタマイズを可能にします。
ルールベースの合成データを生成する方法
当社のプラットフォームは、計算列関数によるルールベースの合成データ生成をサポートしています。計算列関数を使用すると、単純な算術演算から複雑な論理計算や統計計算まで、データやその他の列に対して幅広い操作を実行できます。
数値を丸めたり、日付の一部を抽出したり、平均を計算したり、テキストを変換したりする場合でも、これらの関数は必要なデータを正確に作成するための柔軟性を提供します。
ルールベースの合成データ

データ作成 3の手順
特定のデータに基づいてデータを作成する
ビジネスの論理
ユーザーは、モッカーや計算列などのツールを使用してビジネス ロジックを適用することで、カスタマイズされたデータを生成できます。

テーブル間のデータ関係を維持する
ユーザーはテーブル間で一貫したマップされた値を維持できるため、データの関係が保持され、信頼性が確保されます。

データセットを拡張してテストと分析を改善する
ユーザーは統計的な一貫性を維持しながらデータセットを拡張し、テストや分析の目的でデータの価値を高めることができます。


よくあるご質問
ルールベースで生成された合成データとは、事前定義された (ビジネス) ルールと制約に従って人工またはシミュレートされた合成データを作成するプロセスを指します。このアプローチでは、合成データを生成するために特定のガイドライン、条件、関係を定義します。
ニュースレターに登録する
合成データの最新ニュースを常にチェック