Mula sa Privacy hanggang Posibilidad: Paggamit ng Synthetic Data sa pamamagitan ng pinagsamang Syntho Engine sa SAS Viya bilang bahagi ng SAS Hackathon upang i-unlock ang data na sensitibo sa privacy

Ina-unlock namin ang buong potensyal ng data ng pangangalagang pangkalusugan gamit ang generative AI sa panahon ng SAS Hackathon.

Bakit i-unlock ang data ng pangangalaga sa kalusugan na sensitibo sa privacy?

Ang pangangalaga sa kalusugan ay lubhang nangangailangan ng mga insight sa data drive. Dahil ang pangangalagang pangkalusugan ay kulang sa kawani, labis na pinipilit na may potensyal na magligtas ng mga buhay. Gayunpaman, ang data ng pangangalagang pangkalusugan ay ang pinaka sensitibong data sa privacy at samakatuwid ay naka-lock. Ang data na sensitibo sa privacy na ito:

  • Nakakaubos ng oras sa pag-access
  • Nangangailangan ng malawak na papeles
  • At hindi basta-basta magagamit

Ito ay may problema, dahil ang aming layunin para sa hackathon na ito ay hinuhulaan ang pagkasira at pagkamatay bilang bahagi ng pananaliksik sa kanser para sa isang nangungunang ospital. Iyon ang dahilan kung bakit nagtutulungan sina Syntho at SAS para sa ospital na ito, kung saan ina-unlock ng Syntho ang data gamit ang sintetikong data at napagtanto ng SAS ang mga insight ng data sa SAS Viya, ang nangungunang analytics platform.

Sintetikong data?

Ang aming Syntho Engine ay bumubuo ng ganap na bagong artipisyal na nabuong data. Ang pangunahing pagkakaiba, inilalapat namin ang AI upang gayahin ang mga katangian ng totoong data sa mundo sa synthetic na data, at sa isang lawak na maaari pa itong magamit para sa analytics. Kaya naman tinatawag namin itong synthetic data twin. Ito ay kasing ganda ng tunay at istatistikal na kapareho sa orihinal na data, ngunit walang mga panganib sa privacy.

Syntho Engine na isinama sa SAS Viya

Sa panahon ng hackathon na ito, isinama namin ang Syntho Engine API sa SAS Viya bilang hakbang. Dito rin namin napatunayan na ang synthetic data ay talagang kasing ganda ng totoo sa SAS Viya. Bago kami magsimula sa pananaliksik sa kanser, sinubukan namin ang pinagsama-samang diskarte na ito gamit ang isang bukas na dataset at napatunayan kung ang sintetikong data ay talagang kasing-katotohanan sa pamamagitan ng iba't ibang mga pamamaraan ng pagpapatunay sa SAS Viya.

Ang sintetikong data ba ay kasing ganda ng totoo?

Ang mga ugnayan, ang mga ugnayan sa pagitan ng mga variable, ay pinapanatili.

Ang Lugar sa ilalim ng kurba, isang sukatan para sa pagganap ng modelo, ay pinapanatili.

At maging ang variable na kahalagahan, ang predictive power ng mga variable para sa isang modelo, ay nananatili kapag inihambing namin ang orihinal na data sa synthetic na data.

Kaya, maaari nating tapusin na ang sintetikong data na nabuo ng Syntho Engine sa SAS Viya ay talagang kasing-totoo at maaari tayong gumamit ng sintetikong data para sa pagbuo ng modelo. Samakatuwid, maaari tayong magsimula sa pananaliksik na ito ng kanser upang mahulaan ang pagkasira at pagkamatay.

Sintetikong data para sa Cancer Research para sa isang nangungunang ospital

Dito, ginamit namin ang pinagsama-samang Syntho Engine bilang hakbang sa SAS Viya upang i-unlock ang sensitibong data na ito sa privacy gamit ang sintetikong data.

Ang resulta, isang AUC na 0.74 at isang modelo na kayang hulaan ang pagkasira at pagkamatay.

Bilang resulta ng paggamit ng synthetic na data, na-unlock namin ang pangangalagang pangkalusugan na ito sa isang sitwasyong may mas kaunting panganib, mas maraming data at mas mabilis na pag-access sa data.

Pagsamahin ang data mula sa maraming ospital

Hindi lamang ito posible sa loob ng ospital, maaari ding pagsamahin ang data mula sa maraming ospital. Samakatuwid, ang susunod na hakbang ay ang pag-synthesize ng data mula sa maraming ospital. Ang iba't ibang nauugnay na data ng ospital ay na-synthesize bilang input para sa modelo sa SAS Viya sa pamamagitan ng Syntho Engine. Dito, napagtanto namin ang isang AUC na 0.78, na nagpapakita na mas maraming data ang nagreresulta sa mas mahusay na predictive na kapangyarihan ng mga modelong iyon.

resulta

At ito ang mga resulta mula sa hackathon na ito:

  • Ang Syntho ay isinama sa SAS Viya bilang hakbang
  • matagumpay na nabuo ang synthetic data sa pamamagitan ng Syntho sa SAS Viya
  • Ang katumpakan ng sintetikong data ay naaprubahan, dahil ang mga modelong sinanay sa synthetic na marka ng data ay magkapareho at ang mga modelong sinanay sa orihinal na data
  • hinulaan namin ang pagkasira at pagkamatay sa sintetikong data bilang bahagi ng pananaliksik sa kanser
  • at nagpakita ng pagtaas sa AUC kapag pinagsama-sama ang sintetikong data mula sa maraming ospital.

Susunod na mga hakbang

Ang mga susunod na hakbang ay ang

  • isama pa ang mga ospital
  • upang palawigin ang mga kaso ng paggamit at
  • upang i-extend sa anumang iba pang organisasyon, dahil ang mga diskarte ay agnostic sa sektor.

Ito ay kung paano ina-unlock ng Syntho at SAS ang data at napagtanto ang mga insight na hinihimok ng data sa pangangalagang pangkalusugan upang matiyak na mahusay ang mga tauhan ng pangangalagang pangkalusugan, na may normal na presyon upang magligtas ng mga buhay.

Sintetikong Data sa saklaw ng Pangangalagang Pangkalusugan

I-save ang iyong sintetikong data sa ulat ng pangangalagang pangkalusugan!