De la privacidad a la posibilidad: uso de datos sintéticos a través del Syntho Engine integrado en SAS Viya como parte del SAS Hackathon para desbloquear datos confidenciales de privacidad

Desbloqueamos todo el potencial de los datos de atención médica con IA generativa durante el SAS Hackathon.

¿Por qué desbloquear datos de salud sensibles a la privacidad?

El cuidado de la salud necesita con urgencia información sobre la unidad de datos. Porque el cuidado de la salud no tiene suficiente personal, está demasiado presionado con el potencial de salvar vidas. Sin embargo, los datos de atención médica son los datos más sensibles a la privacidad y, por lo tanto, están bloqueados. Estos datos sensibles a la privacidad:

  • Se tarda mucho en acceder
  • Requiere papeleo extenso
  • Y no se puede usar simplemente

Esto es problemático, ya que nuestro objetivo para este hackathon es predecir el deterioro y la mortalidad como parte de la investigación del cáncer para un hospital líder. Es por eso que Syntho y SAS colaboran para este hospital, donde Syntho desbloquea datos con datos sintéticos y SAS realiza análisis de datos con SAS Viya, la plataforma de análisis líder.

¿Datos sintéticos?

Nuestro Syntho Engine genera datos completamente nuevos generados artificialmente. La diferencia clave es que aplicamos IA para imitar las características de los datos del mundo real en los datos sintéticos, y hasta tal punto que incluso se puede usar para análisis. Es por eso que lo llamamos un gemelo de datos sintéticos. Es tan bueno como real y estadísticamente idéntico a los datos originales, pero sin los riesgos de privacidad.

Syntho Engine integrado en SAS Viya

Durante este hackatón, integramos la API Syntho Engine en SAS Viya como paso. Aquí también validamos que los datos sintéticos son tan buenos como los reales en SAS Viya. Antes de comenzar con la investigación del cáncer, probamos este enfoque integrado con un conjunto de datos abierto y validamos si los datos sintéticos son realmente tan buenos como los reales a través de varios métodos de validación en SAS Viya.

¿Los datos sintéticos son tan buenos como los reales?

Las correlaciones, las relaciones entre variables, se conservan.

Se conserva el Área bajo la curva, una medida del rendimiento del modelo.

E incluso la importancia de las variables, el poder predictivo de las variables para un modelo, se mantiene cuando comparamos los datos originales con los datos sintéticos.

Por lo tanto, podemos concluir que los datos sintéticos generados por Syntho Engine en SAS Viya son tan buenos como los reales y que podemos usar datos sintéticos para el desarrollo de modelos. Por lo tanto, podemos comenzar con esta investigación del cáncer para predecir el deterioro y la mortalidad.

Datos sintéticos para la investigación del cáncer para un hospital líder

Aquí, usamos el Syntho Engine integrado como paso en SAS Viya para desbloquear estos datos sensibles a la privacidad con datos sintéticos.

El resultado, un AUC de 0.74 y un modelo que es capaz de predecir el deterioro y la mortalidad.

Como resultado del uso de datos sintéticos, pudimos desbloquear esta atención médica en una situación con menos riesgo, más datos y un acceso a datos más rápido.

Combinar datos de varios hospitales

Esto no solo es posible dentro del hospital, sino que también se pueden combinar datos de varios hospitales. Por lo tanto, el siguiente paso fue sintetizar datos de múltiples hospitales. Se sintetizaron diferentes datos hospitalarios relevantes como entrada para el modelo en SAS Viya a través de Syntho Engine. Aquí, nos dimos cuenta de un AUC de 0.78, lo que demuestra que más datos dan como resultado un mejor poder predictivo de esos modelos.

Resultados

Y estos son los resultados de este hackathon:

  • Syntho está integrado en SAS Viya como paso
  • los datos sintéticos se generan con éxito a través de Syntho en SAS Viya
  • Se aprueba la precisión de los datos sintéticos, ya que los modelos entrenados en datos sintéticos obtienen una puntuación similar a la de los modelos entrenados en datos originales
  • predijimos el deterioro y la mortalidad en datos sintéticos como parte de la investigación del cáncer
  • y demostró un aumento en el AUC al combinar datos sintéticos de múltiples hospitales.

Próximos pasos

Los siguientes pasos son para

  • incluir más hospitales
  • ampliar los casos de uso y
  • para extender a cualquier otra organización, ya que las técnicas son independientes del sector.

Así es como Syntho y SAS desbloquean datos y obtienen información basada en datos en el cuidado de la salud para asegurarse de que el cuidado de la salud cuente con el personal adecuado, con la presión normal para salvar vidas.

Datos sintéticos en la cobertura sanitaria

¡Guarde sus datos sintéticos en el informe de atención médica!