Van privaatheid tot moontlikheid: Gebruik sintetiese data via die geïntegreerde Syntho Engine in SAS Viya as deel van die SAS Hackathon om privaatheidsensitiewe data te ontsluit

Ons ontsluit die volle potensiaal van gesondheidsorgdata met generatiewe KI tydens die SAS Hackathon.

Waarom privaatheidsensitiewe gesondheidsorgdata ontsluit?

Gesondheidsorg het insigte oor datastasies baie nodig. Omdat gesondheidsorg onderbeman is, oordruk is met die potensiaal om lewens te red. Gesondheidsorgdata is egter die mees privaatheidsensitiewe data en is dus gesluit. Hierdie privaatheid sensitiewe data:

  • Is tydrowend om toegang te verkry
  • Vereis uitgebreide papierwerk
  • En kan nie sommer gebruik word nie

Dit is problematies, want ons doelwit vir hierdie hackathon is om agteruitgang en sterftes te voorspel as deel van kankernavorsing vir 'n toonaangewende hospitaal. Daarom werk Syntho en SAS saam vir hierdie hospitaal, waar Syntho data met sintetiese data ontsluit en SAS data-insigte realiseer met SAS Viya, die voorste analitiese platform.

Sintetiese data?

Ons Syntho Engine genereer heeltemal nuwe kunsmatig gegenereerde data. Sleutelverskil, ons pas KI toe om die kenmerke van werklike wêrelddata in die sintetiese data na te boots, en tot so 'n mate dat dit selfs vir analise gebruik kan word. Daarom noem ons dit 'n sintetiese data-tweeling. Dit is so goed soos werklik en statisties identies aan die oorspronklike data, maar sonder die privaatheidsrisiko's.

Syntho Engine geïntegreer in SAS Viya

Tydens hierdie hackathon het ons as stap die Syntho Engine API in SAS Viya geïntegreer. Hier het ons ook bekragtig dat die sintetiese data inderdaad so goed soos eg is in SAS Viya. Voordat ons met die kankernavorsing begin het, het ons hierdie geïntegreerde benadering met 'n oop datastel getoets en bekragtig of die sintetiese data wel so-goed-soos werklik is via verskeie valideringsmetodes in SAS Viya.

Is sintetiese data so goed soos werklik?

Die korrelasies, die verbande tussen veranderlikes, word bewaar.

Die area onder die kromme, 'n maatstaf vir modelprestasie, word bewaar.

En selfs die veranderlike belangrikheid, die voorspellende krag van veranderlikes vir 'n model, geld wanneer ons die oorspronklike data met die sintetiese data vergelyk.

Daarom kan ons tot die gevolgtrekking kom dat sintetiese data wat deur die Syntho Engine in SAS Viya gegenereer word, inderdaad so goed-soos-werklik is en dat ons sintetiese data vir modelontwikkeling kan gebruik. Daarom kan ons met hierdie kankernavorsing begin om agteruitgang en mortaliteit te voorspel.

Sintetiese data vir Kankernavorsing vir 'n toonaangewende hospitaal

Hier het ons die geïntegreerde Syntho Engine as stap in SAS Viya gebruik om hierdie privaatheidsensitiewe data met sintetiese data te ontsluit.

Die resultaat, 'n AUC van 0.74 en 'n model wat in staat is om agteruitgang en mortaliteit te voorspel.

As gevolg van die gebruik van sintetiese data, kon ons hierdie gesondheidsorg ontsluit in 'n situasie met minder risiko, meer data en vinniger datatoegang.

Kombineer data van verskeie hospitale

Dit is nie net moontlik binne die hospitaal nie, ook data van verskeie hospitale kan gekombineer word. Die volgende stap was dus om data van verskeie hospitale te sintetiseer. Verskillende relevante hospitaaldata is gesintetiseer as insette vir die model in SAS Viya via die Syntho Engine. Hier het ons 'n AUC van 0.78 besef, wat bewys dat meer data lei tot 'n beter voorspellingskrag van daardie modelle.

Results

En dit is die resultate van hierdie hackathon:

  • Syntho is geïntegreer in SAS Viya as stap
  • sintetiese data word suksesvol gegenereer via Syntho in SAS Viya
  • Sintetiese data-akkuraatheid word goedgekeur, aangesien modelle wat op sintetiese data opgelei is, soortgelyk is as modelle wat op oorspronklike data opgelei is
  • ons het agteruitgang en mortaliteit op sintetiese data voorspel as deel van kankernavorsing
  • en het 'n toename in AUC getoon wanneer sintetiese data van verskeie hospitale gekombineer is.

Volgende stappe

Volgende stappe is om

  • sluit meer hospitale in
  • gebruiksgevalle uit te brei en
  • uit te brei na enige ander organisasie, aangesien die tegnieke sektoragnosties is.

Dit is hoe Syntho en SAS data ontsluit en data-gedrewe insigte in gesondheidsorg besef om seker te maak gesondheidsorg is goed beman, met normale druk om lewens te red.

Sintetiese data in gesondheidsorgdekking

Stoor u sintetiese data in gesondheidsorgverslag!