SAS Hackathon laikā mēs atraisām visu veselības aprūpes datu potenciālu, izmantojot ģeneratīvo AI.
Veselības aprūpei ļoti nepieciešams datu piedziņas ieskats. Tā kā veselības aprūpē ir nepietiekams personāls, pārmērīgs spiediens un potenciāls glābt dzīvības. Tomēr veselības aprūpes dati ir visjutīgākie dati, un tāpēc tie ir bloķēti. Šie konfidencialitātes sensitīvie dati:
Tas ir problemātiski, jo mūsu šī hakatona mērķis ir prognozēt stāvokļa pasliktināšanos un mirstību vadošās slimnīcas vēža izpētes ietvaros. Tāpēc Syntho un SAS sadarbojas šajā slimnīcā, kur Syntho atbloķē datus ar sintētiskiem datiem un SAS realizē datu ieskatus ar SAS Viya, vadošo analītikas platformu.
Mūsu Syntho Engine ģenerē pilnīgi jaunus mākslīgi ģenerētus datus. Galvenā atšķirība ir tā, ka mēs izmantojam AI, lai sintētiskos datos atdarinātu reālās pasaules datu īpašības, un tādā mērā, ka tos var izmantot pat analītikai. Tāpēc mēs to saucam par sintētisko datu dvīni. Tie ir tikpat labi kā reāli un statistiski identiski sākotnējiem datiem, taču bez privātuma riskiem.
Šī hakatona laikā mēs kā soli integrējām Syntho Engine API SAS Viya. Šeit mēs arī apstiprinājām, ka sintētiskie dati patiešām ir tikpat labi kā reāli SAS Viya. Pirms mēs sākām ar vēža izpēti, mēs pārbaudījām šo integrēto pieeju ar atvērtu datu kopu un apstiprinājām, vai sintētiskie dati patiešām ir tik labi, cik reāli, izmantojot dažādas SAS Viya validācijas metodes.
Korelācijas, attiecības starp mainīgajiem, tiek saglabātas.
Laukums zem līknes, modeļa veiktspējas mērs, tiek saglabāts.
Un pat mainīgā nozīme, modeļa mainīgo prognozēšanas spēja, saglabājas, ja salīdzinām sākotnējos datus ar sintētiskajiem datiem.
Tādējādi mēs varam secināt, ka sintētiskie dati, ko SAS Viya ģenerē Syntho Engine, patiešām ir tikpat labi kā reāli un ka mēs varam izmantot sintētiskos datus modeļa izstrādei. Tāpēc mēs varam sākt ar šo vēža izpēti, lai prognozētu stāvokļa pasliktināšanos un mirstību.
Šeit mēs izmantojām integrēto Syntho Engine kā soli SAS Viya, lai atbloķētu šos konfidencialitātes sensitīvos datus ar sintētiskiem datiem.
Rezultātā AUC ir 0.74 un modelis, kas spēj paredzēt stāvokļa pasliktināšanos un mirstību.
Sintētisko datu izmantošanas rezultātā mēs varējām atbloķēt šo veselības aprūpi situācijā ar mazāku risku, vairāk datu un ātrāku piekļuvi datiem.
Tas ir iespējams ne tikai slimnīcas ietvaros, bet arī var apvienot datus no vairākām slimnīcām. Tādējādi nākamais solis bija datu sintezēšana no vairākām slimnīcām. Dažādi attiecīgie slimnīcu dati tika sintezēti kā ievade SAS Viya modelim, izmantojot Syntho Engine. Šeit mēs sapratām, ka AUC ir 0.78, parādot, ka vairāk datu nodrošina labāku šo modeļu paredzamo jaudu.
Un šie ir šī hakatona rezultāti:
Nākamie soļi ir
Tādā veidā Syntho un SAS atbloķē datus un realizē uz datiem balstītu ieskatu veselības aprūpē, lai nodrošinātu, ka veselības aprūpē ir pietiekami daudz darbinieku un normālu spiedienu glābt dzīvības.