すべての投稿を見る

ヘルスケアにおける合成データの力を引き出す: 専門家へのインタビュー

医療を前進させ、患者を第一に考え、コストを抑えながら科学的な進歩を促すものは何でしょうか? それは豊富なデータです。AI と高度な分析により、私たちは研究から市場戦略、患者ケアまで、データを通じて医療を再構築しています。

しかし、このデータ主導の時代では、課題が目立っています。品質の問題、データの不足、法的な障害により、状況は複雑になっています。幸いなことに、解決策はあります。医療における合成データの活用は、実行可能な解決策です。

I’m  ウリアナ・クラインスカSyntho の合成データ コンサルタントです。業界のリーダーたちとの興味深いディスカッションにぜひご参加ください。

このインタビューでは、洞察、成功事例、実用的なソリューションを掘り下げ、医療における合成データの可能性に焦点を当てています。それでは、最初の質問に移りましょう。

今日のヘルスケアにおけるデータ関連の主な課題は何ですか?

ウィム: そうですね、ヘルステック分野では、患者に価値をもたらし、治療に本当に変化をもたらし、イノベーションを通じて競争相手から抜きん出ることへの強い意欲があります。現在私たちが直面している主な課題は、データ主導のイノベーションを利用して医療スタッフの負担を軽減し、価値を生み出すことです。 

必要なデータへのアクセスは、特にデータが機密情報である医療においては大きな障害となります。そのデータにアクセスできなければ、ソリューションの構築は不可能となり、進歩が妨げられ、価値を提供できなくなります。そのため、私たちの主な焦点は、これらの障壁を克服し、データ駆動型医療ソリューションの開発に必要なデータを取得する方法を見つけることです。

ヘルスケアの分野では、現在、主に高度な分析と機械学習 (ML) 技術がイノベーションを推進しているという意見に賛成ですか? 賛成の場合、企業はどのようにしてこれらの技術を効果的に活用して競争に勝ち、すべてのヘルスケア関係者に価値をもたらすことができるのでしょうか?

エドウィン: 確かにそうです。しかし、分析や機械学習は新しい概念ではありません。合成データや generative AI実のところ、こうした手法はかなり前から、数十年も前から存在しています。しかし、私がよく目にするのは、多くの組織が分析と最新の機械学習モデルを具体的な成果に結び付けるのに苦労しているということです。問題は、データから意思決定までのエンドツーエンドのプロセスが欠如していることにあります。ここで、分析ライフサイクルが役立ちます。

ヘルスケアにおけるこの分析ライフサイクルについて詳しく教えていただけますか? このプロセスには何が含まれますか?

エドウィン: はい。分析ライフサイクルは 3 つの重要なステップで構成されています。

  1. Rescale データ: 何よりもまず、質の高いデータにアクセスし、その質をさらに向上させることが重要です。 
  2. モデル構築: 最適なアプローチを決定するために多数の実験を実行し、複数のモデルを迅速に構築してから、どれを本番環境に導入するかを決定する必要があります。
  3. 展開: モデルの価値を最大限に引き出すには、リアルタイム、バッチ、ストリーミングのいずれのプロセスであっても、実稼働環境にモデルを展開する必要があります。

データからモデリング、展開、そして再びデータに戻るという無限ループを作成するには、これらのステップ間の移行がスムーズである必要があります。データとモデルの両方を適切に監視できるようにするため、ガバナンスも各フェーズで重要です。

ここでの問題は、残念ながら多くのモデルが、私が言うところのベッドサイドにたどり着けないことです。組織がこのフレームワークを整備していなければ、イノベーションは患者に届かず、私たちが話しているような優れた価値をもたらすことができません。エンドツーエンドのプロセスの欠如、つまりいずれかのステップで何かが欠けていることが、問題の根源です。 合成データ生成と堅牢なAIシステムは物事を揺るがす可能性がある.

あなたが言及したもう一つの課題、つまり医療におけるデータへのアクセスについてはどうでしょうか? データへのアクセスと共有を取り巻く法的な複雑さにはどのようなものがありますか?

フレデリック: 米国の HIPAA や EU の GDPR などのデータ プライバシー法は、あなたのあらゆる行動に影を落とします。これらの法律は、個人を特定できる情報 (PII) と保護対象医療情報 (PHI) の保護と使用に関する厳格なルールを定めているため重要です。しかし、医療目的でデータにアクセスして共有しようとすると、これらの法律が障害のように感じられることがよくあります。

国境を越えたデータ転送は、複雑さをさらに増します。医療機関は、患者の症状、診断、治療結果に関する重要なデータを欠いていることがよくあります。そのため、研究と分析のためにさまざまな国からデータを収集します。しかし、それは思ったほど簡単ではありません。契約上の義務に対処し、同意要件を調整し、匿名化基準が標準を満たしていることを確認する必要があります。

データの所有権の概念も複雑さを増しています。完全な所有権は必ずしも明確ではないかもしれませんが、データの使用と共有に対する制御を主張することは不可欠です。

医療データのアクセスと共有に関する法的な状況は紆余曲折に満ちています。それを乗り越えるには、細部にまで目を配り、コンプライアンスを深く理解し、多大な忍耐力が必要です。 

幸いなことに、合成データが潜在的な解決策として登場しました。合成データが、あなたが挙げた課題にどのように対処できるかを教えていただけますか?

Wim: 合成データは、これらの課題に対処する上で、まさに画期的なものです。厳格なプライバシー基準を維持しながら、生産に価値をもたらし、患者、顧客、利害関係者に同様に利益をもたらします。

Syntho では、さまざまな合成データ生成方法を 1 つの屋根の下にまとめた包括的なソリューションを提供しています。

このアプローチにより、組織は特定のユースケースに応じて複数のソリューションを検討できます。AI 生成データ、匿名化技術、模擬データなど、Syntho は柔軟性と汎用性を提供します。当社はお客様と緊密に連携して、お客様のニーズに最適なアプローチを特定し、データから価値へのシームレスで効率的な移行を保証します。

具体的なユースケースについてお話しいただきましたが、現在、医療の分野で合成データはどのように応用されているのでしょうか?

エドウィン: それは素晴らしい質問です。合成データは、医療だけでなく、複数の業界にわたる何百もの事例で使用されています。合成データが活躍する具体的なシナリオをいくつか挙げてみましょう。

まず、合成データは、実際のデータが不足していたり​​存在しない場合にギャップを埋めることができます。これは、 テストデータ or デモの構築組織は実際のデータに依存せずにソリューションを紹介できるためです。

2 番目に、合成データは既存のデータセットを拡張するときに役立ちます。たとえば、不正行為の検出を考えてみましょう。不正行為の合成ケースを生成することで、組織はデータセットを強化し、不正行為を早期に特定するための堅牢なモデルをトレーニングできます。

合成データを使用すると、組織は次のような特別なデータセットを作成することもできます。 テスト目的特定のシナリオを設計する場合でも、独自のケースを生成する場合でも、合成データはアプリやシステムを徹底的にテストする柔軟性を提供します。

最後に、 完全なデータセットまたはデータベースを統合する 合成データの最も魅力的な使用例の1つです。これは、プライバシーを保護しながら、実際のデータの特性を模倣するためにデータセットをゼロから作成する場合です。このアプローチにより、モデルをより迅速に構築し、複数のソースからのデータを統合できます。多くの病院や機関からのデータを合成することで、組織は分析とモデルトレーニングのための包括的なデータセットを作成し、関連する法的障壁を克服できます。 データ共有.

それは有望ですね。しかし、さまざまなシナリオで合成データを広く使用することを妨げる障害はあるのでしょうか? 最初に思い浮かぶ懸念は法的規制です...

フレデリック: 匿名化が必要なデータを扱うようになると、突然、GDPR 準拠の世界に戻ってしまいます。ありがたいことに、ヨーロッパ、特にオランダでは、規制当局は合成データを匿名化の実行可能な手段として認めています。

合成データを取得すると、それはもはや個人データではなくなり、特定の企業の管理下や所有権下になくなります。これにより、刺激的な可能性が生まれます。他の企業と連携してデータセットを組み合わせることで、患者に関するさらに多くの洞察を明らかにできます。

もちろん、GDPR のコンプライアンス要件は依然として存在します。しかし、ヨーロッパでは、いくつかのオプションを利用できます。州法が異なる米国では、状況はやや複雑です。全体として、ここにはまだ多くの可能性があります。合成データは、規制に準拠しながら、探索と革新を行うための新しい道を提供します。

ウィム: Frederick が今言ったことを踏まえて、Syntho プラットフォームのアプローチを例として挙げたいと思います。特に、当社のインテリジェントなデータ匿名化戦略についてお話しします。スマートな匿名化プロセスでは、AI で生成された合成模擬データを使用してデータを匿名化します。これにより、組織は次の手順で機密情報を準拠した識別不可能なデータに変換できます。

  • 当社の匿名化ソフトウェアは、既存のデータセットを分析し、個人を特定できる情報 (PII) と保護された健康情報 (PHI) を識別します。
  • 組織は必要に応じて機密データを人工情報に選択的に置き換えることができます。
  • このツールは、準拠データを含む新しいデータセットを生成します。

このテクノロジーは、組織間の安全なコラボレーションとデータ交換を促進します。また、複数のリレーショナル データベース間でデータのコンプライアンスを確保するのに特に役立ちます。

さらに、当社が設計したスマートな匿名化プロセスは、一貫したマッピングを通じてデータの関係性を維持します。企業は、生成されたデータを詳細なビジネス分析、ML モデルのトレーニング、テストに使用できます。

ヘルスケアの取り組みにおいて合成データ ソリューションの実装を検討している組織に、どのような法的アドバイスを提供しますか?

フレデリック: 医療分野で合成データ ソリューションを実装する前に、立ち止まってよく考えることが重要です。まず、合成データを使用する理由と、それが組織の課題をどのように解決できるかを自問してください。アイデアに賛同したら、デジタル資産を扱っているのか、それとも合成データの他の用途を模索しているのかを検討してください。使用するデータの所有者は誰ですか? これらは、この旅に乗り出す際に尋ねるべき重要な質問です。 

ライフサイクル プロセス全体にわたるガバナンス戦略に関する Edwin の提案は、まさにその通りです。ブレインストーミングの段階であっても、早い段階でリスク評価を実行することが重要です。その結果は、特定の状況で規制コンプライアンスに取り組む際に役立ちます。

EU は最近 AI 規制を導入しましたが、これにより、特にモデルのトレーニングのために合成データから実際のデータに移行する際には、責任が重要になります。 EU AI 法 AI 関連技術を「許容できない」から「危険性が低い」までリスクレベル別に分類しています。責任の影響を細部に至るまで理解する必要があります。 

合成データであっても、悪意のある人の手に渡れば悪用される可能性があるため、セキュリティは依然として最優先事項です。そのため、データはこれまで以上に安全に保管する必要があります。

最後に、データの使用と機密性に関する契約上の義務に細心の注意を払ってください。場合によっては、データ自体を超えて、その固有の価値も含まれることがあります。これらすべての考慮事項を把握するために、法律、サイバーセキュリティ、AI の専門家にアドバイスを求めてください。 

Wim さん、法律上の問題以外に、合成データをワークフローに導入する際にクライアントが予想する具体的な課題はありますか? どのようにすればその課題を軽減できるでしょうか?

ウィム: 重要な懸念事項の1つは、特にAIによって生成された合成データの場合、合成データの精度が現実世界のデータセットと比較してどの程度であるかということです。これに対処するために、私たちは 合成データの正確性と信頼性を検証するための厳密な分析 本物のデータセットに対して。

さらに、 説明可能なAI は、当社の実装戦略において極めて重要です。説明可能な AI の原則を順守することで、AI モデルの透明性が高まり、関係者が AI 主導の意思決定の根拠を理解できるようになります。これにより、合成データが信頼でき、有用であるという信頼と自信が生まれます。

時系列データなどの複雑なデータ型は、別のハードルを生み出します。組織は、特に時系列データのような複雑なデータ タイプや、合成データ生成を実稼働レベルに拡張する場合、合成データの理解と生成に困難に直面する可能性があります。当社は、合成データをワークフローに統合できるように、お客様が直面するあらゆる課題をガイドする準備ができています。さらに、Syntho のプラットフォームはユーザー フレンドリーであるため、お客様は実際にそのような問題に取り組む必要はありません。 

最後に、医療分野で合成データ戦略を実装するためのベスト プラクティスをいくつか紹介して締めくくりたいと思います。Wim さん、喜んでいくつかシェアしていただけると思います。

ウィム: もちろんです。まず、合成データが何に必要なのかを把握する必要があります。たとえば、テストやデモだけであれば、それほど正確である必要はないかもしれません。ただし、AI モデルのトレーニングに使用する場合は、正確さを最優先にする必要があります。

私たちはインテルなどのパートナーと協力して、合成データに基づいて構築されたモデルのパフォーマンスをテストしてきました。 実際のデータに基づいて構築されたものと比較して結果は非常に有望でした。合成データがモデルのトレーニングに効果的であることが確認されただけです。

合成データを使用する場合は、元のデータにアクセスした直後に、早い段階で統合するのが最適です。合成データから始めることで、実際のデータにアクセスするために数か月待つことなく、モデルの開発とイノベーションをすぐに開始できます。これにより、プロセスがスムーズになります。その後、合成データを使用してモデルを構築およびテストし、実際の使用に最適なモデルを選択できます。

しかし、モデルを構築するだけでは不十分です。すべてが適切かつ安全に行われるようにする必要があります。つまり、データ アクセスからモデルの展開まで、すべてのステップでルールとチェックを実施する必要があります。

総合的に見て、合成データは医療機関、製薬会社、ソフトウェア開発者にとって画期的な利点をもたらします。患者の機密情報を保護する統計的に正確なデータを作成することで、プライバシー侵害や高額の罰金のリスクを大幅に削減できます。 

このイノベーションは、官僚的なハードルを回避して時間とリソースを節約するだけでなく、信頼できるデータへのアクセスが制限されている研究への扉を開きます。希少疾患の研究を促進し、医学研究における予測精度を高めます。 

データの偏りや立法上の慎重さなどの課題は確かに存在しますが、Syntho の合成データ エンジンのようなソリューションは、プライバシー、正確性、アクセシビリティを基本原則として、データ主導のヘルスケアを再構築することを約束します。

結論する

業界の専門家が共有した洞察を通じて、医療分野全体にわたる合成データの多様な用途と利点が明らかになりました。データ不足への対処から予測精度の向上まで、合成データは意味のある変化を推進するための多目的ツールとして登場しています。

データの偏りや法的制約などの課題を認識しながらも、合成データはプライバシーを保護し、正確性を確保し、データに基づいた意思決定を促進することで医療に革命を起こす大きな可能性を秘めているというコンセンサスは明確です。 

のようなソリューションを使用すると、 シント すべての合成データ生成アプローチを 1 つのプラットフォームに統合することで、イノベーションによるヘルスケアの変革がはるかに容易かつコスト効率よく実現します。

当社の専門家と直接お話しいただけます。 デモを予約するご質問がございましたら、喜んでお答えいたします。