Da privacidade á posibilidade: usar datos sintéticos a través do motor Syntho integrado en SAS Viya como parte do SAS Hackathon para desbloquear datos sensibles á privacidade

Desbloqueamos todo o potencial dos datos sanitarios coa IA xerativa durante o SAS Hackathon.

Por que desbloquear datos de saúde sensibles á privacidade?

A sanidade precisa moito de información sobre as unidades de datos. Porque a asistencia sanitaria está insuficiente, está demasiado presionada e ten o potencial de salvar vidas. Non obstante, os datos sanitarios son os datos máis sensibles á privacidade e, polo tanto, están bloqueados. Estes datos sensibles á privacidade:

  • O acceso leva moito tempo
  • Require un amplo trámite
  • E non se pode usar simplemente

Isto é problemático, xa que o noso obxectivo para este hackathon é prever o deterioro e a mortalidade como parte da investigación do cancro para un hospital líder. É por iso que Syntho e SAS colaboran para este hospital, onde Syntho desbloquea datos con datos sintéticos e SAS realiza coñecementos de datos con SAS Viya, a plataforma analítica líder.

Datos sintéticos?

O noso motor Syntho xera datos xerados artificialmente completamente novos. A diferenza fundamental, aplicamos a IA para imitar as características dos datos do mundo real nos datos sintéticos, e ata tal punto que incluso se pode usar para analíticas. É por iso que o chamamos xemelgo de datos sintéticos. É tan bo como real e estatisticamente idéntico aos datos orixinais, pero sen riscos de privacidade.

Syntho Engine integrado en SAS Viya

Durante este hackathon, integramos a API Syntho Engine en SAS Viya como paso. Aquí tamén validamos que os datos sintéticos son tan bos como reais en SAS Viya. Antes de comezar coa investigación do cancro, probamos este enfoque integrado cun conxunto de datos aberto e validamos se os datos sintéticos son realmente tan bos como reais mediante varios métodos de validación en SAS Viya.

Os datos sintéticos son tan bos como reais?

Consérvanse as correlacións, as relacións entre variables.

Consérvase a Área baixo a curva, unha medida para o rendemento do modelo.

E mesmo a importancia da variable, o poder preditivo das variables para un modelo, mantense cando comparamos os datos orixinais cos datos sintéticos.

Polo tanto, podemos concluír que os datos sintéticos xerados polo Syntho Engine en SAS Viya son realmente tan bos como reais e que podemos usar datos sintéticos para o desenvolvemento de modelos. Por iso, podemos comezar con esta investigación sobre o cancro para predicir o deterioro e a mortalidade.

Datos sintéticos para a investigación do cancro para un hospital líder

Aquí, usamos o Syntho Engine integrado como paso en SAS Viya para desbloquear estes datos sensibles á privacidade con datos sintéticos.

O resultado, un AUC de 0.74 e un modelo que é capaz de prever o deterioro e a mortalidade.

Como resultado do uso de datos sintéticos, puidemos desbloquear esta asistencia sanitaria nunha situación con menos risco, máis datos e un acceso máis rápido aos datos.

Combina datos de varios hospitais

Isto non só é posible dentro do hospital, tamén se poderían combinar datos de varios hospitais. Polo tanto, o seguinte paso foi sintetizar os datos de varios hospitais. Sintetizáronse diferentes datos hospitalarios relevantes como entrada para o modelo en SAS Viya a través do Syntho Engine. Aquí, decatámonos dun AUC de 0.78, o que demostra que máis datos resulta nun mellor poder preditivo deses modelos.

Resultados

E estes son os resultados deste hackathon:

  • Syntho está integrado en SAS Viya como paso
  • os datos sintéticos xéranse con éxito a través de Syntho en SAS Viya
  • Apróbase a precisión dos datos sintéticos, xa que os modelos adestrados en datos sintéticos obteñen unha puntuación similar aos modelos adestrados en datos orixinais
  • predicimos o deterioro e a mortalidade en datos sintéticos como parte da investigación do cancro
  • e demostrou un aumento do AUC ao combinar datos sintéticos de varios hospitais.

Próximos pasos

Os seguintes pasos son para

  • incluír máis hospitais
  • para ampliar os casos de uso e
  • para estenderse a calquera outra organización, xa que as técnicas son agnósticas do sector.

Así é como Syntho e SAS desbloquean datos e obteñen coñecementos baseados en datos na asistencia sanitaria para asegurarse de que a asistencia sanitaria estea ben dotada, cunha presión normal para salvar vidas.

Datos sintéticos na cobertura sanitaria

Garda os teus datos sintéticos no informe de saúde!