Od zasebnosti do možnosti: uporaba sintetičnih podatkov prek vgrajenega motorja Syntho v SAS Viya kot del SAS Hackathona za odklepanje podatkov, občutljivih na zasebnost

Med SAS Hackathonom sprostimo polni potencial zdravstvenih podatkov z generativno umetno inteligenco.

Zakaj odkleniti zasebno občutljive zdravstvene podatke?

Zdravstvo nujno potrebuje vpogled v podatkovni pogon. Ker je v zdravstvu premalo osebja, preobremenjeno z možnostjo reševanja življenj. Vendar pa so zdravstveni podatki najbolj občutljivi podatki o zasebnosti in so zato zaklenjeni. Ti podatki, občutljivi na zasebnost:

  • Dostop je zamuden
  • Zahteva obsežno dokumentacijo
  • In ga ni mogoče preprosto uporabiti

To je problematično, saj je naš cilj tega hekatona predvidevanje poslabšanja in umrljivosti kot del raziskav raka za vodilno bolnišnico. Zato Syntho in SAS sodelujeta za to bolnišnico, kjer Syntho odklene podatke s sintetičnimi podatki, SAS pa realizira vpogled v podatke s SAS Viya, vodilno analitično platformo.

Sintetični podatki?

Naš Syntho Engine ustvarja popolnoma nove umetno ustvarjene podatke. Ključna razlika je, da umetno inteligenco uporabljamo za posnemanje značilnosti podatkov iz resničnega sveta v sintetičnih podatkih in do te mere, da jo lahko uporabimo celo za analitiko. Zato ga imenujemo sintetični podatkovni dvojček. So tako dobri kot resnični in statistično enaki izvirnim podatkom, vendar brez tveganj za zasebnost.

Syntho Engine integriran v SAS Viya

Med tem hackathonom smo kot korak integrirali API Syntho Engine v SAS Viya. Tu smo tudi potrdili, da so sintetični podatki v SAS Viya res enako dobri kot resnični. Preden smo začeli z raziskavo o raku, smo preizkusili ta integrirani pristop z odprtim naborom podatkov in z različnimi validacijskimi metodami v SAS Viya potrdili, ali so sintetični podatki res tako dobri kot resnični.

Ali so sintetični podatki tako dobri kot resnični?

Ohranjene so korelacije, razmerja med spremenljivkami.

Območje pod krivuljo, merilo za zmogljivost modela, je ohranjeno.

In celo pomembnost spremenljivke, napovedna moč spremenljivk za model, velja, ko primerjamo izvirne podatke s sintetičnimi podatki.

Zato lahko sklepamo, da so sintetični podatki, ki jih ustvari Syntho Engine v SAS Viya, res tako dobri kot resnični in da lahko uporabimo sintetične podatke za razvoj modela. Zato lahko začnemo s to raziskavo raka, da napovemo poslabšanje in umrljivost.

Sintetični podatki za raziskave raka za vodilno bolnišnico

Tukaj smo uporabili integriran Syntho Engine kot korak v SAS Viya za odklepanje teh zasebno občutljivih podatkov s sintetičnimi podatki.

Rezultat, AUC 0.74 in model, ki lahko napove poslabšanje in umrljivost.

Kot rezultat uporabe sintetičnih podatkov smo lahko odklenili to zdravstveno varstvo v razmerah z manj tveganja, več podatkov in hitrejšim dostopom do podatkov.

Združite podatke iz več bolnišnic

To ni mogoče samo v bolnišnici, lahko se združijo tudi podatki iz več bolnišnic. Zato je bil naslednji korak sintetizacija podatkov iz več bolnišnic. Različni ustrezni bolnišnični podatki so bili sintetizirani kot vhodni podatki za model v SAS Viya prek Syntho Engine. Tukaj smo spoznali AUC 0.78, kar dokazuje, da več podatkov povzroči boljšo napovedno moč teh modelov.

Rezultati

In to so rezultati tega hackathona:

  • Syntho je integriran v SAS Viya kot korak
  • sintetični podatki so uspešno ustvarjeni prek Syntho v SAS Viya
  • Točnost sintetičnih podatkov je odobrena, saj modeli, usposobljeni na sintetičnih podatkih, dosegajo podobne rezultate kot modeli, usposobljeni na izvirnih podatkih.
  • smo napovedali poslabšanje in umrljivost na sintetičnih podatkih kot del raziskav raka
  • in dokazano povečanje AUC pri kombiniranju sintetičnih podatkov iz več bolnišnic.

Naslednji koraki

Naslednji koraki so

  • vključite več bolnišnic
  • za razširitev primerov uporabe in
  • razširiti na katero koli drugo organizacijo, saj so tehnike sektorsko agnostične.

Tako Syntho in SAS odkleneta podatke in uresničita podatkovno usmerjene vpoglede v zdravstveno varstvo, da zagotovita, da je zdravstveno varstvo dobro opremljeno z normalnim pritiskom za reševanje življenj.

Kritje Sintetični podatki v zdravstvu

Shranite svoje sintetične podatke v zdravstveno poročilo!