Syntho はあらゆる形式の表形式データをサポートします
シント は、あらゆる形式の表形式データをサポートし、複雑なデータ型もサポートします。 表形式データは、行と列で構成された構造化データの一種で、通常はテーブルの形式です。 ほとんどの場合、このタイプのデータはデータベース、スプレッドシート、およびその他のデータ管理システムで見られます。
時系列データ
分析と予測のために時間ベースのパターンをシミュレートするための合成データセットを生成します。
複数テーブルのデータセットとデータベース
複数のテーブルにわたって合成データセットを作成し、複雑なデータベース構造を複製します。
任意の言語 (オランダ語、英語など)
さまざまなアプリケーション向けに任意の言語でデータを生成します。
任意のアルファベット (英語、中国語、日本語など)
世界中で使用できるように、さまざまなアルファベットでデータを生成します。
地理的位置データ(GPSなど)
地理空間アプリケーション向けにリアルな GPS と位置ベースのデータを生成します。
ユーザードキュメントはこちらをご覧ください
大規模なマルチテーブルデータセットとデータベース
Syntho は、大規模な複数テーブルのデータセットとデータベースをサポートしています。 また、複数テーブルのデータセットとデータベースについては、すべての合成データ生成ジョブのデータ精度を最大化し、これをデータ品質レポートで示します。 さらに、SAS データの専門家は、当社の合成データを外部の視点から評価し、承認しました。
データの精度を損なうことなく、計算要件を最小限に抑えるようにプラットフォームを最適化しました (例: GPU は必要ありません)。 さらに、Auto Scaling をサポートしているため、巨大なデータベースを合成できます。
特に複数テーブルのデータセットとデータベースの場合、データ タイプ、スキーマ、および形式を自動的に検出して、データの精度を最大化します。 マルチテーブル データベースの場合、テーブル リレーションシップの自動推論と合成をサポートしています。 参照整合性を維持する. 最後に、私たちは 包括的なテーブルと列の操作 複数テーブルのデータセットとデータベースに対しても、合成データ生成ジョブを構成できるようにします。
保持された参照整合性
Syntho は、テーブル関係の自動推論と合成をサポートします。ソース テーブルを反映する主キーと外部キーを自動的に推論して生成し、データベース全体とさまざまなシステム間の関係を保護して参照整合性を維持します。外部キー関係は、参照整合性を維持するためにデータベースから自動的にキャプチャされます。または、スキャンを実行して潜在的な外部キー関係をスキャンしたり (外部キーがデータベースで定義されていないが、たとえばアプリケーション レイヤーで定義されている場合)、手動で追加したりすることもできます。
包括的なテーブルと列の操作
好みに合わせて、テーブルまたは列を合成、複製、または除外します。 複数のテーブルを持つデータベースを合成する場合、通常、合成データ生成ジョブを構成して、目的のテーブルの組み合わせを含めたり除外したりできるようにしたいと考えています。
テーブルモード:
- 合成:AIを使用してテーブルを合成します
- 重複: D電子識別 個人を特定できる情報(PII) またはテーブルを複製する
- 除外: Eターゲットデータベースからテーブルを除外する
時系列データのサポート
Syntho は時系列データにも対応しています。 時系列データは、収集されて時系列順に編成されたデータの一種であり、各データ ポイントは特定の時点を表します。 このタイプのデータは、多くの分野で一般的に使用されています。 これは、たとえば、金融 (顧客が取引を行う場合など) や医療 (患者が処置を受ける場合) など、時間の経過に伴う傾向やパターンを理解することが重要な他の多くの分野に当てはまります。
時系列データは、定期的または不定期に収集できます。 データは、温度などの単一の変数で構成される単変量、または株式ポートフォリオの価値や企業の収益と費用など、経時的に測定される複数の変数で構成される多変量の場合があります。
時系列データの分析には、多くの場合、時間の経過に伴うパターン、傾向、季節変動の特定、および過去のデータに基づく将来の値の予測が含まれます。 時系列データの分析から得られた洞察は、売上予測、天気予報、ネットワークの異常検出など、幅広い用途に使用できます。 したがって、データを合成するときは、時系列データのサポートが必要になることがよくあります。
サポートされている時系列データのタイプ
- 等間隔の時系列
- 不等間隔の時系列
- 長さが等しい時系列
- 長さが等しくない時系列
- 観測値が欠落している時系列
- 巨大な時系列文字列
自己相関は品質保証レポートに含まれています
Synthoがサポートするデータの概要
Data Type | Description | 例 |
---|---|---|
整数 | 正または負の小数点以下のない整数 | 42 |
フロート | 小数点以下の桁数が有限または無限の正または負の XNUMX 進数 | 3,14 |
ブーリアン | バイナリ値 | 真か偽か、はいかいいえなど。 |
String | テキスト、カテゴリ、またはその他のデータを表す一連の文字 (文字、数字、記号、スペースなど) | "こんにちは世界!" |
日付/時刻 | 日付、時刻、またはその両方の特定の時点を表す値 (任意の日付/時刻形式がサポートされています) | 2023-02-18 13:45:00 |
オブジェクト | 複数の値とプロパティを含むことができる複雑なデータ型で、ディクショナリ、マップ、またはハッシュ テーブルとも呼ばれます | { "name": "John", "age": 30, "address": "123 Main St." } |
配列 | リストまたはベクターとも呼ばれる、同じ型の値の順序付けられたコレクション | [1、2、3、4、5] |
ヌル | データが存在しないことを表す特別な値で、多くの場合、欠落している値または不明な値を示すために使用されます | ヌル |
文字 | 文字、数字、記号などの単一の文字 | 「A」 |
他の | 他の形式の表形式データがサポートされています |