合成データについて質問がありますか?

わかりました! 幸いなことに、私たちは答えを持っており、私たちは助けるためにここにいます。 

以下の質問を開いて、リンクをクリックして詳細を確認してください。 ここに記載されていない、より複雑な質問がありますか? 専門家に直接お問い合わせください!

よくある質問

元のデータは、人(クライアント、患者など)とのすべてのやり取りで、すべての内部プロセスを介して収集されますが、合成データはコンピューターアルゴリズムによって生成されます。 このコンピューターアルゴリズムは、まったく新しい人工的なデータポイントを生成します。 詳しくはこちら.

元のデータと比較した合成データのデータ品質が重要であるため、最近、SAS(分析のマーケットリーダー)とのウェビナーを開催して、これを実証しました。 SASの分析エキスパートであるEdwinvan Unenは、さまざまな分析(AI)評価を通じて、Synthoから生成された合成データセットを評価し、結果を共有しました。 ここでそのビデオの短い要約を見る.

データ分析のデータテストを実行する前にデータを匿名化する場合、いくつかの要因が関係しています。

  1. ほとんどすべての場合、匿名化されたデータは、特定の一意の行(医療記録など)により、個人までさかのぼることができます。
  2. 匿名化または一般化すればするほど、より多くのデータを破壊します。 これにより、データの品質が低下し、洞察が低下します。
  3. 匿名化は、データ形式によって機能が異なります。 これは、スケーラブルではなく、非常に時間がかかる可能性があることを意味します

合成データは、これらすべての欠点などを解決します。 その違いは非常に印象的で、私たちはそれについてビデオを作りました。 ここで見てください.

よくある質問

合成データ

一般的に、ほとんどのクライアントは次の目的で合成データを使用します。

  • ソフトウェアのテストと開発
  • モデル開発と高度な分析(AI)
  • 製品デモ

詳しくはこちら.

Synthoは、Synthetic Data Twinを使用して、元のデータと比較して優れた合成データ品質を目指しています。 これは、最先端のAIモデルを使用する合成データソフトウェアを使用して行います。 これらのAIモデルは、まったく新しいデータポイントを生成し、元のデータの特性、関係、統計パターンを、元のデータであるかのように使用できる範囲で保持するようにモデル化します。 続きを読む。

はい、そうです。 さまざまな付加価値のある合成データの最適化および拡張機能を提供して、(「ダーティ」または「クリーン」の両方の)データを次のレベルに引き上げます。 続きを読む。

データ品質

Synthoは、生成されたすべての合成データセットの品質レポートを提供します。 品質レポートには、多変量分布などのより高度な測定値で強化された、集計、分布、相関などのさまざまな基本統計が含まれています。 詳しくはこちら.

はい、そうです。 合成データには、元のデータに存在することを知らなかったパターンも含まれています。

しかし、私たちの言葉だけを信じてはいけません。 SAS(分析のグローバルマーケットリーダー)の分析専門家は、合成データの(AI)評価を行い、元のデータと比較しました。 奇妙? 見る ここでイベント全体 またはについての短いバージョンを見る ここのデータ品質.

はい、そうです。 あるデータセットの列を別のデータセットの列にリンクできるため、大規模なデータベースで参照整合性とビジネスロジックを維持できます。 特にソフトウェアテストの目的で合成データを使用する場合、これは非常に役立ちます。

これについてもっと知りたいですか? 専門家に直接お問い合わせください.

個人情報保護

いいえ、しません。 Syntho Engineは、オンプレミスまたはDockerを介してプライベートクラウドに簡単にデプロイできます。 あなたがしなければならない唯一のことはあなたのデータをエンジンに接続することであり、合成データはあなたのファイアウォールの後ろに生成されます。 何にもアクセスできません。 デプロイと接続のプロセスについてもっと読む.

はい、できます。 データセットを合成する場合、合成データに個人の再識別に使用できる機密情報が含まれていないことが不可欠です。 の このビデオ、Marijnは、これを実証するために品質レポートにあるプライバシー対策を紹介します。

Synthoエンジン

Syntho EngineはDockerコンテナーで出荷され、選択した環境に簡単にデプロイしてプラグインできます。

可能な展開オプションは次のとおりです。

  • オンプレミス
  • 任意の(プライベート)クラウド
  • IBM HyperProtectCloudでのSynthoホスティング

詳しくはこちら.

Synthoを使用すると、データベース、アプリケーション、データパイプライン、またはファイルシステムに簡単に接続できます。 生成された合成データを、オンプレミスまたは(プライベート)クラウドなど、目的の場所との間で簡単に読み取って共有できます。

サポートされている接続機能:

  • Dockerとのプラグアンドプレイ
  • 20以上のデータベースコネクタ
  • 20以上のファイルシステムコネクタ

詳しくはこちら.

当然、生成時間はデータベースのサイズによって異なります。 ただし、合成には通常1時間もかからないと言っても過言ではありません。

非常にスケーラブルです。 合成は高速で、すべてのタイプのデータセットで同じように機能します。 基本的に、合成できるデータセット/データベースの量に制限はありません。 詳細はこちら.

全くない。 合成データの利点、動作、および使用例を完全に理解するには多少の努力が必要かもしれませんが、合成のプロセスは非常に単純であり、基本的なコンピューター知識を持っている人なら誰でもそれを行うことができます。 合成プロセスの詳細については、チェックアウトしてください このページ or デモをリクエストする.

Syntho Engineは、構造化された表形式のデータで最適に機能します。 これらの構造内で、次のデータ型をサポートしています。

  • テーブルでフォーマットされた構造データ(カテゴリ、数値など)
  • 直接識別子とPII
  • 大規模なデータセットとデータベース
  • 地理的位置データ(GPSなど)
  • 時系列データ
  • マルチテーブルデータベース(参照整合性付き)
  • テキストデータを開く

詳しくはこちら.

私たちは合成データの専門家です。 しかし、心配しないでください、 私たちのチームは本物です!

Synthoに連絡する 専門家のXNUMX人が光速であなたと連絡を取り、合成データの価値を探ります。