Nuo privatumo iki galimybės: sintetinių duomenų naudojimas naudojant SAS Viya integruotą Syntho Engine kaip SAS Hackathon dalį, kad būtų atrakinti privatumo jautrūs duomenys

SAS Hackathon metu išnaudojame visą sveikatos priežiūros duomenų potencialą naudodami generatyvųjį AI.

Kodėl atrakinti privatumui jautrius sveikatos priežiūros duomenis?

Sveikatos priežiūrai labai reikia duomenų kaupimo įžvalgų. Kadangi sveikatos priežiūros srityje trūksta darbuotojų, per daug spaudžiama, kad būtų galima išgelbėti gyvybes. Tačiau sveikatos priežiūros duomenys yra labiausiai jautrūs privatumo duomenys, todėl jie yra užrakinti. Šie konfidencialūs privatumo duomenys:

  • Prieiga užima daug laiko
  • Reikalauja daug dokumentų
  • Ir negali būti tiesiog naudojamas

Tai yra problematiška, nes mūsų šio hakatono tikslas prognozuoti pablogėjimą ir mirtingumą kaip pirmaujančios ligoninės vėžio tyrimų dalį. Štai kodėl Syntho ir SAS bendradarbiauja šioje ligoninėje, kur Syntho atrakina duomenis sintetiniais duomenimis, o SAS realizuoja duomenų įžvalgas su SAS Viya, pirmaujančia analizės platforma.

Sintetiniai duomenys?

Mūsų Syntho Engine generuoja visiškai naujus dirbtinai sugeneruotus duomenis. Pagrindinis skirtumas yra tai, kad dirbtinį intelektą taikome tam, kad imituotume realaus pasaulio duomenų charakteristikas sintetiniuose duomenyse ir tokiu mastu, kad juos būtų galima naudoti net analizei. Štai kodėl mes tai vadiname sintetinių duomenų dvyniu. Tai kaip tikra ir statistiškai identiški pirminiams duomenims, tačiau nekelia pavojaus privatumui.

Syntho Engine integruotas į SAS Viya

Šio hakatono metu kaip žingsnį integravome Syntho Engine API į SAS Viya. Čia taip pat patvirtinome, kad SAS Viya sintetiniai duomenys iš tikrųjų yra tokie pat geri kaip tikri. Prieš pradėdami vėžio tyrimus, išbandėme šį integruotą metodą naudodami atvirą duomenų rinkinį ir įvairiais SAS Viya patvirtinimo metodais patvirtinome, ar sintetiniai duomenys iš tikrųjų yra tokie pat geri, kaip tikri.

Ar sintetiniai duomenys tokie pat geri, kaip tikri?

Išsaugomos koreliacijos, ryšiai tarp kintamųjų.

Plotas po kreive, modelio veikimo matas, išsaugomas.

Ir net kintamojo svarba, nuspėjamoji modelio kintamųjų galia, išlieka, kai lyginame pirminius duomenis su sintetiniais duomenimis.

Taigi galime daryti išvadą, kad SAS Viya „Syntho Engine“ sugeneruoti sintetiniai duomenys iš tikrųjų yra tokie pat geri, kaip tikri ir kad galime naudoti sintetinius duomenis modelio kūrimui. Taigi galime pradėti nuo šio vėžio tyrimo, kad prognozuotume pablogėjimą ir mirtingumą.

Sintetiniai pirmaujančios ligoninės vėžio tyrimų duomenys

Čia mes panaudojome integruotą „Syntho Engine“ kaip „SAS Viya“ veiksmą, kad atrakintume šiuos privatumo jautrius duomenis sintetiniais duomenimis.

Rezultatas – 0.74 AUC ir modelis, galintis numatyti pablogėjimą ir mirtingumą.

Naudodami sintetinius duomenis galėjome atrakinti šią sveikatos priežiūrą esant mažesnei rizikai, daugiau duomenų ir greitesnei prieigai prie duomenų.

Sujunkite duomenis iš kelių ligoninių

Tai įmanoma ne tik ligoninėje, bet ir kelių ligoninių duomenis galima sujungti. Taigi kitas žingsnis buvo kelių ligoninių duomenų sintezė. Įvairūs svarbūs ligoninės duomenys buvo susintetinti kaip įvestis SAS Viya modeliui naudojant Syntho Engine. Čia mes supratome, kad AUC yra 0.78, parodydamas, kad daugiau duomenų suteikia geresnę šių modelių nuspėjamąją galią.

rezultatai

Ir štai šio hakatono rezultatai:

  • Syntho yra integruotas į SAS Viya kaip žingsnis
  • sintetiniai duomenys sėkmingai generuojami naudojant Syntho SAS Viya
  • Sintetinių duomenų tikslumas yra patvirtintas, nes modeliai, mokomi dirbti su sintetiniais duomenimis, vertinami panašiai nei modeliai, mokomi naudojant originalius duomenis
  • mes prognozavome pablogėjimą ir mirtingumą sintetiniais duomenimis kaip vėžio tyrimų dalį
  • ir parodė AUC padidėjimą, kai derinami kelių ligoninių sintetiniai duomenys.

Tolesni žingsniai

Kiti žingsniai yra

  • įtraukti daugiau ligoninių
  • pratęsti naudojimo atvejus ir
  • taikyti bet kuriai kitai organizacijai, nes metodai yra sektoriaus agnostiški.

Taip Syntho ir SAS atrakina duomenis ir įgyvendina duomenimis pagrįstas įžvalgas sveikatos priežiūros srityje, kad būtų užtikrintas geras sveikatos priežiūros personalas ir įprastas spaudimas gelbėti gyvybes.

Sintetiniai duomenys sveikatos priežiūros srityje

Išsaugokite sintetinius duomenis sveikatos priežiūros ataskaitoje!