No privātuma līdz iespējai: sintētisko datu izmantošana, izmantojot SAS Viya integrēto Syntho Engine kā daļu no SAS Hackathon, lai atbloķētu konfidenciālus datus

SAS Hackathon laikā mēs atraisām visu veselības aprūpes datu potenciālu, izmantojot ģeneratīvo AI.

Kāpēc atbloķēt privātuma sensitīvus veselības aprūpes datus?

Veselības aprūpei ļoti nepieciešams datu piedziņas ieskats. Tā kā veselības aprūpē ir nepietiekams personāls, pārmērīgs spiediens un potenciāls glābt dzīvības. Tomēr veselības aprūpes dati ir visjutīgākie dati, un tāpēc tie ir bloķēti. Šie konfidencialitātes sensitīvie dati:

  • Piekļuve ir laikietilpīga
  • Nepieciešama apjomīga dokumentu noformēšana
  • Un to nevar vienkārši izmantot

Tas ir problemātiski, jo mūsu šī hakatona mērķis ir prognozēt stāvokļa pasliktināšanos un mirstību vadošās slimnīcas vēža izpētes ietvaros. Tāpēc Syntho un SAS sadarbojas šajā slimnīcā, kur Syntho atbloķē datus ar sintētiskiem datiem un SAS realizē datu ieskatus ar SAS Viya, vadošo analītikas platformu.

Sintētiskie dati?

Mūsu Syntho Engine ģenerē pilnīgi jaunus mākslīgi ģenerētus datus. Galvenā atšķirība ir tā, ka mēs izmantojam AI, lai sintētiskos datos atdarinātu reālās pasaules datu īpašības, un tādā mērā, ka tos var izmantot pat analītikai. Tāpēc mēs to saucam par sintētisko datu dvīni. Tie ir tikpat labi kā reāli un statistiski identiski sākotnējiem datiem, taču bez privātuma riskiem.

Syntho Engine integrēts SAS Viya

Šī hakatona laikā mēs kā soli integrējām Syntho Engine API SAS Viya. Šeit mēs arī apstiprinājām, ka sintētiskie dati patiešām ir tikpat labi kā reāli SAS Viya. Pirms mēs sākām ar vēža izpēti, mēs pārbaudījām šo integrēto pieeju ar atvērtu datu kopu un apstiprinājām, vai sintētiskie dati patiešām ir tik labi, cik reāli, izmantojot dažādas SAS Viya validācijas metodes.

Vai sintētiskie dati ir tikpat labi kā reāli?

Korelācijas, attiecības starp mainīgajiem, tiek saglabātas.

Laukums zem līknes, modeļa veiktspējas mērs, tiek saglabāts.

Un pat mainīgā nozīme, modeļa mainīgo prognozēšanas spēja, saglabājas, ja salīdzinām sākotnējos datus ar sintētiskajiem datiem.

Tādējādi mēs varam secināt, ka sintētiskie dati, ko SAS Viya ģenerē Syntho Engine, patiešām ir tikpat labi kā reāli un ka mēs varam izmantot sintētiskos datus modeļa izstrādei. Tāpēc mēs varam sākt ar šo vēža izpēti, lai prognozētu stāvokļa pasliktināšanos un mirstību.

Sintētiskie dati vēža izpētei vadošai slimnīcai

Šeit mēs izmantojām integrēto Syntho Engine kā soli SAS Viya, lai atbloķētu šos konfidencialitātes sensitīvos datus ar sintētiskiem datiem.

Rezultātā AUC ir 0.74 un modelis, kas spēj paredzēt stāvokļa pasliktināšanos un mirstību.

Sintētisko datu izmantošanas rezultātā mēs varējām atbloķēt šo veselības aprūpi situācijā ar mazāku risku, vairāk datu un ātrāku piekļuvi datiem.

Apvienojiet datus no vairākām slimnīcām

Tas ir iespējams ne tikai slimnīcas ietvaros, bet arī var apvienot datus no vairākām slimnīcām. Tādējādi nākamais solis bija datu sintezēšana no vairākām slimnīcām. Dažādi attiecīgie slimnīcu dati tika sintezēti kā ievade SAS Viya modelim, izmantojot Syntho Engine. Šeit mēs sapratām, ka AUC ir 0.78, parādot, ka vairāk datu nodrošina labāku šo modeļu paredzamo jaudu.

rezultāti

Un šie ir šī hakatona rezultāti:

  • Syntho ir integrēts SAS Viya kā solis
  • sintētiskie dati tiek veiksmīgi ģenerēti, izmantojot Syntho SAS Viya
  • Sintētisko datu precizitāte ir apstiprināta, jo modeļi, kas apmācīti sintētisko datu izmantošanā, ir līdzīgi modeļiem, kas apmācīti uz sākotnējiem datiem
  • mēs prognozējām stāvokļa pasliktināšanos un mirstību, pamatojoties uz sintētiskiem datiem kā daļu no vēža izpētes
  • un demonstrēja AUC palielināšanos, apvienojot sintētiskos datus no vairākām slimnīcām.

Nākamie soļi

Nākamie soļi ir

  • ietver vairāk slimnīcu
  • lai paplašinātu lietošanas gadījumus un
  • attiecināt uz jebkuru citu organizāciju, jo metodes ir nozares agnostiskas.

Tādā veidā Syntho un SAS atbloķē datus un realizē uz datiem balstītu ieskatu veselības aprūpē, lai nodrošinātu, ka veselības aprūpē ir pietiekami daudz darbinieku un normālu spiedienu glābt dzīvības.

Sintētiskie dati veselības aprūpē

Saglabājiet savus sintētiskos datus veselības aprūpes pārskatā!