案例分析

產生合成數據以與生命線分享數據

關於客戶

Lifelines 自 2006 年以來開展了一項超過 167,000 名參與者的多代隊列研究,以收集相關數據和生物樣本。 這些數據與生活方式、健康、個性、BMI、血壓、認知能力等有關。 生命線提供了這些寶貴的數據,使其成為國內和國際研究人員、組織、政策制定者和其他通常專注於預防、預測、診斷和治療疾病的利害關係人的重要資源。

這種情況

由於生物樣本庫的使命是讓研究人員、組織、政策制定者和其他利害關係人更容易取得其數據,因此制定策略解決方案來保護參與者的隱私至關重要。 因此,Lifelines 與 Syntho 合作合成數據,從而增強其可訪問性並保護參與者的隱私。 作為使用真實數據的替代方案,每個人現在都可以使用合成數據。 我們鼓勵任何對這些數據感興趣的人尋求進一步的資訊和支持。

解決方案

至於採用新的解決方案,Lifelines 希望透過初步評估研究在實務上評估 Synthetic Data 和 Syntho。 在這裡,它批准了 Syntho 的合成資料與開源解決方案和商業解決方案相比的準確性、隱私性和易用性。 這裡,對於佈景來說,地理位置和縱向資料至關重要。 作為預覽,我們可以看到真實數據、合成數據的參與者郵遞區號的分佈,以及真實數據和合成數據之間的比較圖。 由於圖表緊密重疊,Lifelines 得出的結論是保真度和準確性得以保留。 由於這只是本次評估的一個要素,因此可根據要求提供其他結果。

合成生命線

研究人員、組織、政策制定者和其他利益相關者現在有機會接收合成數據集

對 Syntho 產生的合成資料的成功評估標誌著 Lifelines 在利用新解決方案使資料更易於存取同時保護參與者的隱私方面向前邁出了重要一步。 因此,生命線現在利用合成資料來創建人工資料集,在不損害參與者隱私的情況下反映真實資料的統計特性。 因此,對此資料感興趣的研究人員、組織、政策制定者和其他利害關係人現在有機會接收與 Syntho 合作產生的客製化合成資料集。 透過採用合成數據,生命線增加了對數據的存取並加速了研究,同時為參與者保持了最高的隱私保護。 這強調了他們對科學進步和隱私保護的承諾。

好處

更快地訪問數據

合成數據可以通過最大限度地減少合規文書工作和程序來更快地訪問數據。 這使得數據用戶能夠更快地分析、更快的假設檢驗和更早的結果,而不會因合規程序而造成延遲。

保護參與者的隱私

通過整合合成數據,參與者信息保持安全,有效保護其敏感詳細信息。 合成數據等隱私增強技術可以提高參與者對其數據受到保護的信心,鼓勵他們積極參與研究項目。 這增強了人們對該生物庫作為可靠且值得信賴的資源的信任,進一步加速了參與者的參與。

提高數據的可訪問性

合成數據為與可能不喜歡訪問真實數據或可能訪問最少數據的組織共享信息提供了新的可能性。 這種方法可以提高數據的可訪問性,同時減輕與共享實際數據相關的風險。

購買前使用數據目錄預覽數據ue

隨著數據商業化,潛在買家通常更喜歡在沙盒環境等環境中進行購買之前預覽數據。 然而,由於合規性文書工作要求以及提前交換數據存在貶值的風險,使用真實數據進行預覽會出現問題。 人們可以通過使用合成數據目錄來克服這些挑戰,使潛在買家能夠方便地預覽數據,從而增強商業化進程。

組織: 生命線

地點: The Netherlands

行業: 衛生保健

尺寸: 100 +員工

用例: 分析(Analytics)

目標數據: 醫療保健歷史數據 

網站: 在請求

醫療保健中的綜合數據封面

將您的綜合數據保存在醫療保健報告中!