在 SAS 黑客马拉松期间,我们通过生成 AI 释放了医疗保健数据的全部潜力。
医疗保健迫切需要数据驱动洞察力。 因为医疗保健人员不足,拯救生命的潜力压力过大。 但是,医疗保健数据是对隐私最敏感的数据,因此会被锁定。 此隐私敏感数据:
这是有问题的,因为我们这次黑客马拉松的目标是预测恶化和死亡率,作为一家领先医院癌症研究的一部分。 这就是 Syntho 和 SAS 为这家医院合作的原因,Syntho 通过合成数据解锁数据,而 SAS 通过领先的分析平台 SAS Viya 实现数据洞察。
我们的 Syntho 引擎生成全新的人工生成数据。 关键区别在于,我们应用人工智能在合成数据中模拟真实世界数据的特征,甚至可以用于分析。 这就是为什么我们称其为合成数据孪生。 它与原始数据一样真实且在统计上完全相同,但没有隐私风险。
在这次黑客马拉松中,我们将 Syntho Engine API 作为步骤集成到 SAS Viya 中。 在这里,我们还验证了合成数据确实与 SAS Viya 中的真实数据一样好。 在开始癌症研究之前,我们使用开放数据集测试了这种集成方法,并通过 SAS Viya 中的各种验证方法验证了合成数据是否确实与真实数据一样好。
相关性,变量之间的关系,被保留下来。
曲线下面积是模型性能的衡量标准,将保留。
当我们将原始数据与合成数据进行比较时,甚至变量的重要性,变量对模型的预测能力也成立。
因此,我们可以得出结论,由 SAS Viya 中的 Syntho Engine 生成的合成数据确实和真实的一样好,我们可以使用合成数据进行模型开发。 因此,我们可以从这项癌症研究着手来预测恶化和死亡率。
在这里,我们使用集成的 Syntho Engine 作为 SAS Viya 中的一个步骤,用合成数据解锁这种隐私敏感数据。
结果,AUC 为 0.74,模型能够预测恶化和死亡率。
由于使用合成数据,我们能够在风险更低、数据更多和数据访问更快的情况下解锁这种医疗保健。
这不仅可以在医院内实现,还可以合并来自多家医院的数据。 因此,下一步是综合多家医院的数据。 通过 Syntho Engine 合成不同的相关医院数据作为 SAS Viya 模型的输入。 在这里,我们实现了 0.78 的 AUC,表明更多的数据可以提高这些模型的预测能力。
这些是这次黑客马拉松的结果:
接下来的步骤是
这就是 Syntho 和 SAS 如何解锁数据并实现医疗保健中数据驱动的洞察力,以确保医疗保健人员配备齐全,并承受拯救生命的正常压力。