Privaatsusest võimaluseni: sünteetiliste andmete kasutamine SAS Viya integreeritud Syntho mootori kaudu SAS Hackathoni osana privaatsustundlike andmete avamiseks

Kasutame SAS Hackathonil generatiivse tehisintellektiga tervishoiuandmete kogu potentsiaali.

Miks avada privaatsustundlikud tervishoiuandmed?

Tervishoid vajab hädasti andmeajami teadmisi. Kuna tervishoius on vähe töötajaid ja see on üle survestatud, mis võib päästa elusid. Tervishoiuandmed on aga kõige privaatsustundlikumad andmed ja on seetõttu lukustatud. Need privaatsuse tundlikud andmed:

  • Juurdepääs on aeganõudev
  • Nõuab põhjalikku paberimajandust
  • Ja seda ei saa lihtsalt kasutada

See on problemaatiline, kuna meie selle häkatoni eesmärk ennustab juhtiva haigla vähiuuringute osana seisundi halvenemist ja suremust. Seetõttu teevad Syntho ja SAS selle haigla jaoks koostööd, kus Syntho avab andmed sünteetiliste andmetega ja SAS teostab andmetest ülevaate juhtiva analüüsiplatvormi SAS Viya abil.

Sünteetilised andmed?

Meie Syntho Engine genereerib täiesti uusi kunstlikult loodud andmeid. Peamine erinevus on see, et me rakendame tehisintellekti, et jäljendada sünteetilistes andmetes reaalse maailma andmete omadusi ja seda niivõrd, et seda saab kasutada isegi analüütika jaoks. Seetõttu kutsume seda sünteetiliseks andmekaksikuks. See on sama hea kui tegelik ja statistiliselt identne algandmetega, kuid ilma privaatsusriskideta.

SAS Viyasse integreeritud Syntho Engine

Selle häkatoni ajal integreerisime sammuna SAS Viyasse Syntho Engine API. Siin kinnitasime ka, et sünteetilised andmed on SAS Viyas tõepoolest sama head kui reaalsed. Enne vähiuuringutega alustamist katsetasime seda integreeritud lähenemisviisi avatud andmekogumiga ja valideerisime SAS Viya erinevate valideerimismeetodite abil, kas sünteetilised andmed on tõepoolest sama head kui reaalsed.

Kas sünteetilised andmed on sama head kui tõelised?

Korrelatsioonid, muutujatevahelised seosed säilivad.

Kõveraalune ala, mudeli jõudluse mõõt, säilib.

Ja isegi muutuja tähtsus, muutujate ennustav jõud mudeli jaoks, kehtib, kui võrdleme algandmeid sünteetiliste andmetega.

Seega võime järeldada, et SAS Viya Syntho Engine'i loodud sünteetilised andmed on tõepoolest sama head kui reaalsed ja et saame mudeli arendamiseks kasutada sünteetilisi andmeid. Seega võime alustada selle vähiuuringuga, et ennustada seisundi halvenemist ja suremust.

Juhtiva haigla vähiuuringute sünteetilised andmed

Siin kasutasime SAS Viya sammuna integreeritud Syntho mootorit, et avada need privaatsustundlikud andmed sünteetiliste andmetega.

Tulemuseks on AUC 0.74 ja mudel, mis suudab ennustada seisundi halvenemist ja suremust.

Sünteetiliste andmete kasutamise tulemusena saime selle tervishoiu avada olukorras, kus risk oli väiksem, rohkem andmeid ja kiirem juurdepääs andmetele.

Ühendage mitme haigla andmed

See pole võimalik ainult haiglasiseselt, vaid ka mitme haigla andmeid saab kombineerida. Seega oli järgmine samm mitme haigla andmete sünteesimine. Erinevad asjakohased haiglaandmed sünteesiti mudeli sisendina SAS Viyas Syntho Engine'i kaudu. Siin saime aru, et AUC on 0.78, mis näitab, et rohkem andmeid annab nende mudelite parema ennustamisvõime.

Tulemused

Ja need on selle häkatoni tulemused:

  • Syntho on sammuna integreeritud SAS Viyasse
  • sünteetilised andmed genereeritakse edukalt Syntho kaudu SAS Viyas
  • Sünteetiliste andmete täpsus on heaks kiidetud, kuna sünteetiliste andmete põhjal koolitatud mudelid on sarnased algandmetel koolitatud mudelitega
  • ennustasime vähiuuringute osana sünteetiliste andmete põhjal halvenemist ja suremust
  • ja näitas AUC suurenemist mitme haigla sünteetiliste andmete kombineerimisel.

Järgmised sammud

Järgmised sammud on

  • hõlmata rohkem haiglaid
  • kasutusjuhtude laiendamiseks ja
  • laiendada mis tahes muule organisatsioonile, kuna tehnikad on sektoriagnostilised.

Nii avavad Syntho ja SAS andmed ja realiseerivad andmepõhiseid teadmisi tervishoius, et tagada tervishoiu hea personal ja tavapärane surve elude päästmiseks.

Sünteetilised andmed tervishoius

Salvestage oma sünteetilised andmed tervishoiuaruandesse!