時系列データの合成が難しい理由
正確に合成するのが難しい
時系列データの合成はより困難です。各行が独立した観測を表す通常の表形式データとは異なり、時系列データには行間の依存関係が含まれており、各行が後続の観測を表します。
オープンソースソリューションは時系列データのサポートが不十分
時系列データの処理にはさまざまなオープンソース パッケージが利用可能ですが、その品質は最適ではないことがよくあります。これらのツールは、時系列分析の複雑さや微妙な違いをすべて完全にサポートしていない可能性があります。
複雑な時系列データのサポート
Syntho エンジンを使用すると、時系列を含むデータを正確に合成できます。私たちのアプローチは、エンティティ テーブルと、縦断的な情報を含む関連テーブルの間の相関関係と統計パターンを適切に捕捉します。これには、次のような時系列などの複雑な時系列構造も含まれます。
- 等間隔の間隔
- 不等間隔な間隔
- 等しい長さ
- 長さが等しくない
- 単変量時系列
- 多変量時系列
主要組織との戦略的パートナーシップ
Synthoは、次のような主要組織と協力しました。 ヒマラヤスギシナイ医療センターこれらの組織は、最も複雑な時系列データを扱っています。これにより、Syntho は最も複雑な時系列を正確に合成できる最適なシーケンス モデルを構築できます。
ユーザードキュメントはこちらをご覧ください
高品質で複雑な時系列データを作成するにはどうすればよいでしょうか?
高度なモデリング技術
Syntho は、時系列データ内の固有のパターンと依存関係をキャプチャするように特別に設計された最先端の AI および機械学習アルゴリズムを活用し、現実的で忠実度の高い合成データセットを保証します。
まれな長いシーケンスの保護しきい値
Syntho には、トレーニング中に使用される最大シーケンス長を制限する高度な設定が用意されており、異常に長いシーケンスを持つ外れ値が識別されるのを防ぎます。
シーケンスモデルの構成
Syntho は、最大シーケンス長やまれな長いシーケンスの保護など、シーケンス モデリング用の構成可能なパラメーターを提供し、計算リソースを効率的に管理し、プライバシーを強化します。
バッチ処理とサンプリング
Syntho は、ユーザーがバッチ サイズを定義し、トレーニング用のランダム サンプルを選択できるようにすることで、パフォーマンスとデータの代表性のバランスを取りながら、データ生成を最適化します。
統計の完全性
合成時系列データが平均、分散、自己相関などの元のデータの統計特性を維持し、実際のシナリオを反映していることを定期的に検証します。
時系列データを合成する方法
3ステップでより多くのデータを生成する
1. ワークスペースを設定する
ソース データベースと宛先データベースで構成されるワークスペースを作成します。
2. データ生成パラメータを設定する
前処理、テーブル設定、PII スキャン、および高度なジェネレーター オプションを設定します。
3. 生成を開始する
生成を開始すると、時系列データの処理が完了します。
Synthoのその他の機能
当社が提供するその他の機能をご覧ください
よくある質問
時系列データは、時間間隔で収集され順序付けられた一連のイベント、観測、または測定値によって特徴付けられるデータ型であり、通常は時間の経過に伴う変数の変化を表し、Syntho によってサポートされています。
- 金融取引: 取引監視のためのクレジットカードやデビットカードによる支払い
- 健康指標: 心拍数、血液値、コレステロール値
- エネルギー消費: スマートメーターデータ、電力使用量
- センサー測定値: 温度、流量などのセンサーからのタイムスタンプ付き測定値。