Da privacidade à possibilidade: usando dados sintéticos por meio do Syntho Engine integrado no SAS Viya como parte do SAS Hackathon para desbloquear dados confidenciais de privacidade

Desvendamos todo o potencial dos dados de saúde com IA generativa durante o SAS Hackathon.

Por que desbloquear dados de saúde sensíveis à privacidade?

A área de saúde precisa muito de insights de movimentação de dados. Porque a saúde está com falta de pessoal, sobrecarregada com o potencial de salvar vidas. No entanto, os dados de saúde são os dados mais sensíveis à privacidade e, portanto, estão bloqueados. Estes dados confidenciais de privacidade:

  • É demorado para acessar
  • Requer extensa papelada
  • E não pode simplesmente ser usado

Isso é problemático, pois nosso objetivo para este hackathon é prever a deterioração e a mortalidade como parte da pesquisa do câncer para um hospital líder. É por isso que a Syntho e a SAS colaboram para este hospital, onde a Syntho desbloqueia dados com dados sintéticos e a SAS realiza insights de dados com a SAS Viya, a plataforma de análise líder.

Dados sintéticos?

Nosso Syntho Engine gera dados gerados artificialmente completamente novos. Diferença fundamental, aplicamos IA para imitar as características dos dados do mundo real nos dados sintéticos e de tal forma que podem até ser usados ​​para análises. É por isso que o chamamos de gêmeo de dados sintéticos. É tão bom quanto real e estatisticamente idêntico aos dados originais, mas sem os riscos de privacidade.

Syntho Engine integrado no SAS Viya

Durante este hackathon, integramos a API do Syntho Engine no SAS Viya como etapa. Aqui também validamos que os dados sintéticos são tão bons quanto os reais no SAS Viya. Antes de começarmos a pesquisa sobre o câncer, testamos essa abordagem integrada com um conjunto de dados aberto e validamos se os dados sintéticos são realmente tão bons quanto os reais por meio de vários métodos de validação no SAS Viya.

Os dados sintéticos são tão bons quanto os reais?

As correlações, as relações entre as variáveis, são preservadas.

A Área sob a curva, uma medida de desempenho do modelo, é preservada.

E mesmo a importância variável, o poder preditivo das variáveis ​​para um modelo, se mantém quando comparamos os dados originais com os dados sintéticos.

Portanto, podemos concluir que os dados sintéticos gerados pelo Syntho Engine no SAS Viya são realmente tão bons quanto os reais e que podemos usar dados sintéticos para o desenvolvimento do modelo. Portanto, podemos começar com essa pesquisa sobre o câncer para prever a deterioração e a mortalidade.

Dados sintéticos para pesquisa de câncer para um hospital líder

Aqui, usamos o Syntho Engine integrado como etapa no SAS Viya para desbloquear esses dados confidenciais de privacidade com dados sintéticos.

O resultado, uma AUC de 0.74 e um modelo capaz de prever deterioração e mortalidade.

Como resultado do uso de dados sintéticos, conseguimos desbloquear esses cuidados de saúde em uma situação com menos risco, mais dados e acesso mais rápido aos dados.

Combine dados de vários hospitais

Isso não só é possível dentro do hospital, mas também os dados de vários hospitais podem ser combinados. Assim, o próximo passo foi sintetizar dados de vários hospitais. Diferentes dados hospitalares relevantes foram sintetizados como entrada para o modelo no SAS Viya por meio do Syntho Engine. Aqui, percebemos uma AUC de 0.78, demonstrando que mais dados resultam em melhor poder preditivo desses modelos.

Resultados

E estes são os resultados deste hackathon:

  • Syntho é integrado no SAS Viya como etapa
  • dados sintéticos são gerados com sucesso via Syntho no SAS Viya
  • A precisão dos dados sintéticos é aprovada, pois os modelos treinados em dados sintéticos pontuam de maneira semelhante aos modelos treinados nos dados originais
  • previmos deterioração e mortalidade em dados sintéticos como parte da pesquisa do câncer
  • e demonstrou aumento na AUC ao combinar dados sintéticos de vários hospitais.

Próximos passos

Os próximos passos são

  • incluir mais hospitais
  • para estender casos de uso e
  • estender a qualquer outra organização, pois as técnicas são agnósticas do setor.

É assim que o Syntho e o SAS desbloqueiam dados e obtêm insights orientados por dados na área da saúde para garantir que a assistência médica tenha uma boa equipe, com pressão normal para salvar vidas.

Cobertura de dados sintéticos em saúde

Salve seus dados sintéticos no relatório de saúde!