Fra privatliv til mulighed: Brug af syntetiske data via den integrerede Syntho Engine i SAS Viya som en del af SAS Hackathon for at låse op for privatlivsfølsomme data

Vi låser op for det fulde potentiale af sundhedsdata med generativ kunstig intelligens under SAS Hackathon.

Hvorfor låse op for privatlivsfølsomme sundhedsdata?

Sundhedsvæsenet har hårdt brug for datadrevindsigt. Fordi sundhedsvæsenet er underbemandet, overpresset med potentialet til at redde liv. Sundhedsdata er dog de mest privatlivsfølsomme data og er derfor låst. Disse privatlivsfølsomme data:

  • Er tidskrævende at få adgang til
  • Kræver omfattende papirarbejde
  • Og kan ikke bare bruges

Dette er problematisk, da vores mål for dette hackathon er at forudsige forværring og dødelighed som en del af kræftforskning for et førende hospital. Derfor samarbejder Syntho og SAS for dette hospital, hvor Syntho låser op for data med syntetiske data, og SAS realiserer dataindsigt med SAS Viya, den førende analyseplatform.

Syntetiske data?

Vores Syntho Engine genererer helt nye kunstigt genererede data. Nøgleforskel, vi anvender AI til at efterligne egenskaberne af data fra den virkelige verden i de syntetiske data, og i en sådan grad, at de endda kan bruges til analyser. Det er derfor, vi kalder det en syntetisk datatvilling. Det er så godt som reelt og statistisk identisk med de originale data, men uden privatlivsrisici.

Syntho Engine integreret i SAS Viya

Under dette hackathon integrerede vi Syntho Engine API i SAS Viya som trin. Her validerede vi også, at de syntetiske data faktisk er så godt som ægte i SAS Viya. Før vi startede med kræftforskningen, testede vi denne integrerede tilgang med et åbent datasæt og validerede, om de syntetiske data faktisk er lige så gode som virkelige via forskellige valideringsmetoder i SAS Viya.

Er syntetiske data lige så gode som ægte?

Korrelationerne, relationerne mellem variabler, er bevaret.

Arealet under kurven, et mål for modellens ydeevne, er bevaret.

Og selv variablens betydning, forudsigelseskraften af ​​variabler for en model, gælder, når vi sammenligner de originale data med de syntetiske data.

Derfor kan vi konkludere, at syntetiske data genereret af Syntho Engine i SAS Viya faktisk er lige så gode som virkelige, og at vi kan bruge syntetiske data til modeludvikling. Derfor kan vi starte med denne kræftforskning for at forudsige forværring og dødelighed.

Syntetiske data til kræftforskning for et førende hospital

Her brugte vi den integrerede Syntho Engine som trin i SAS Viya til at låse disse privatlivsfølsomme data op med syntetiske data.

Resultatet, en AUC på 0.74 og en model, der er i stand til at forudsige forringelse og dødelighed.

Som et resultat af at bruge syntetiske data var vi i stand til at låse op for dette sundhedsvæsen i en situation med mindre risiko, flere data og hurtigere dataadgang.

Kombiner data fra flere hospitaler

Dette er ikke kun muligt inden for hospitalet, også data fra flere hospitaler kan kombineres. Derfor var næste skridt at syntetisere data fra flere hospitaler. Forskellige relevante hospitalsdata blev syntetiseret som input til modellen i SAS Viya via Syntho Engine. Her realiserede vi en AUC på 0.78, hvilket viser, at flere data resulterer i bedre forudsigelsesevne for disse modeller.

Resultater

Og disse er resultaterne fra dette hackathon:

  • Syntho er integreret i SAS Viya som step
  • syntetiske data genereres med succes via Syntho i SAS Viya
  • Syntetisk datanøjagtighed er godkendt, da modeller trænet på syntetiske data scorer på samme måde som modeller trænet på originale data
  • vi forudsagde forringelse og dødelighed på syntetiske data som en del af kræftforskning
  • og viste stigning i AUC ved kombination af syntetiske data fra flere hospitaler.

Næste skridt

Næste skridt er at

  • omfatte flere sygehuse
  • at udvide use cases og
  • at udvide til enhver anden organisation, da teknikkerne er sektoragnostiske.

Det er sådan, Syntho og SAS låser op for data og realiserer datadrevet indsigt i sundhedsvæsenet for at sikre, at sundhedsvæsenet er godt bemandet med normalt pres for at redde liv.

Syntetiske data i sundhedsvæsenet

Gem dine syntetiske data i sundhedsrapporten!