在 伊拉斯謨MC,領先的醫院之一,可以請求 Syntho 生成的合成數據 合成引擎。 “ 智能健康技術中心 (SHTC) – Erasmus MC 30 月 XNUMX 日上週四組織了正式啟動儀式,其中 羅伯特·維恩 (研究室)和 維姆·基斯·詹森 (合成器 ) 回答了問題:'什麼是合成數據?','我們為什麼要做這個?'和 “這在 Erasmus MC 中如何運作?”.
真實數據是通過獲取有關真實患者、員工和內部業務流程的信息來收集的。 另一方面,合成數據是由一種算法生成的,該算法會創建全新的虛擬數據點,其中個人不再存在。
一個重要的區別是使用人工智能在合成數據中模仿和再現真實數據的特徵、模式和屬性。
結果: 人工智能生成的合成數據與真實數據一樣準確。 因此,它甚至可以像真實數據一樣用於分析。
這就是 Syntho 將其稱為“合成數據孿生”的原因:數據是 和真實一樣好,但可以在沒有隱私挑戰的情況下使用。
通過使用合成數據而不是真實數據,我們作為一個組織可以減少風險評估和相關的耗時過程。 它允許我們解鎖更多和額外的數據集。 我們還可以確保可以加快訪問數據的請求,從而縮短“獲取數據的時間”。 有了這個,Erasmus MC 正在為加速數據驅動的創新奠定堅實的基礎。
使用具有代表性的測試數據進行測試和開發對於提供最先進的技術解決方案至關重要。 基於生產數據的合成數據孿生生成的數據可用作 測試數據. 結果:類似生產的數據, privacy by design 在一個工作簡單、快速且可擴展的解決方案中。 此外,通過在創建合成數據時巧妙地使用生成式人工智能,還可以擴大和模擬數據集。 這可能是一個解決方案,例如,當數據不足(數據稀缺)或當您想要對邊緣情況進行上採樣時。
AI 用於對合成數據進行建模,使得統計模式、關係和特徵得以保存,從而使它們能夠 甚至用於分析. 尤其是在模型的開發階段,我們會更喜歡使用合成數據,並且總是挑戰數據的使用者:“合成數據也可以用,為什麼還要用真實數據”?
你想使用合成數據集嗎? 或者您想收到有關可能性的更多信息? 請聯絡 Erasmus MC 研究套件.