Gikan sa Privacy ngadto sa Posibilidad: Paggamit sa Synthetic Data pinaagi sa integrated Syntho Engine sa SAS Viya isip kabahin sa SAS Hackathon aron maablihan ang sensitibo nga data sa privacy

Giablihan namon ang tibuuk nga potensyal sa datos sa pag-atiman sa kahimsog nga adunay generative AI sa panahon sa SAS Hackathon.

Ngano nga giablihan ang sensitibo nga datos sa pag-atiman sa kahimsog sa pagkapribado?

Ang pag-atiman sa kahimsog labi nga nanginahanglan mga panan-aw sa pagmaneho sa datos. Tungod kay ang pag-atiman sa panglawas kulang sa kawani, sobra sa pressure nga adunay potensyal nga makaluwas sa mga kinabuhi. Bisan pa, ang datos sa pag-atiman sa kahimsog mao ang labing sensitibo nga datos sa pagkapribado ug busa gi-lock. Kini nga datos nga sensitibo sa pagkapribado:

  • Nag-usik sa oras sa pag-access
  • Nagkinahanglan ug daghang papeles
  • Ug dili basta-basta gamiton

Kini usa ka problema, tungod kay ang among katuyoan alang sa kini nga hackathon gitagna ang pagkadaot ug pagkamatay ingon bahin sa panukiduki sa kanser alang sa usa ka nanguna nga ospital. Mao nga ang Syntho ug SAS nagtinabangay alang sa kini nga ospital, diin giablihan ni Syntho ang datos nga adunay sintetikong datos ug nahibal-an sa SAS ang mga panan-aw sa datos kauban ang SAS Viya, ang nanguna nga platform sa analytics.

Sintetikong datos?

Ang among Syntho Engine nagmugna og hingpit nga bag-ong artipisyal nga namugna nga datos. Ang hinungdanon nga kalainan, gipadapat namon ang AI aron masundog ang mga kinaiya sa tinuud nga datos sa kalibutan sa sintetikong datos, ug sa usa ka gidak-on nga magamit pa kini alang sa analytics. Mao nga gitawag namon kini nga usa ka synthetic data twin. Maayo kini sama sa tinuod ug parehas sa istatistika sa orihinal nga datos, apan wala’y mga peligro sa pagkapribado.

Ang Syntho Engine gisagol sa SAS Viya

Atol niini nga hackathon, among gisagol ang Syntho Engine API sa SAS Viya isip lakang. Dinhi gipamatud-an usab namon nga ang sintetikong datos ingon ka maayo sa tinuod sa SAS Viya. Sa wala pa kami magsugod sa panukiduki sa kanser, gisulayan namon kini nga hiniusa nga pamaagi sa usa ka bukas nga dataset ug gi-validate kung ang sintetikong datos sa tinuud ingon-maayo-ingon tinuod pinaagi sa lainlaing mga pamaagi sa pag-validate sa SAS Viya.

Tinuod ba ang sintetikong datos?

Ang mga correlations, ang mga relasyon tali sa mga variable, gipreserbar.

Ang Lugar Ubos sa kurba, usa ka sukod sa performance sa modelo, gipreserbar.

Ug bisan ang variable nga importansya, ang prediktibo nga gahum sa mga variable alang sa usa ka modelo, gihuptan kung atong itandi ang orihinal nga datos sa sintetikong datos.

Busa, makahinapos kita nga ang sintetikong datos nga namugna sa Syntho Engine sa SAS Viya sa pagkatinuod ingon-kaayo-nga-tinuod ug nga kita makagamit sa sintetikong datos alang sa pagpalambo sa modelo. Busa, makasugod kita niining panukiduki sa kanser aron matagna ang pagkadaot ug pagka-mortal.

Sintetikong datos alang sa Cancer Research alang sa usa ka nanguna nga ospital

Dinhi, among gigamit ang integrated Syntho Engine isip lakang sa SAS Viya aron maablihan kining sensitibo nga data sa pagkapribado nga adunay sintetikong datos.

Ang resulta, usa ka AUC nga 0.74 ug usa ka modelo nga makahimo sa pagtagna sa pagkadaot ug pagka-mortal.

Isip resulta sa paggamit sa sintetikong datos, nakahimo kami sa pag-abli niini nga pag-atiman sa panglawas sa usa ka sitwasyon nga adunay gamay nga risgo, mas daghang datos ug mas paspas nga pag-access sa datos.

Paghiusa sa datos gikan sa daghang mga ospital

Dili lamang kini posible sa sulod sa ospital, mahimo usab nga mahiusa ang mga datos gikan sa daghang mga ospital. Busa, ang sunod nga lakang mao ang pag-synthesize sa datos gikan sa daghang mga ospital. Ang lainlaing mga may kalabutan nga datos sa ospital gi-synthesize ingon input alang sa modelo sa SAS Viya pinaagi sa Syntho Engine. Dinhi, nahibal-an namon ang usa ka AUC nga 0.78, nga nagpakita nga daghang mga datos ang nagresulta sa mas maayo nga predictive nga gahum sa mga modelo.

Resulta

Ug kini ang mga resulta gikan sa hackathon:

  • Ang Syntho gisagol sa SAS Viya isip lakang
  • malampuson nga namugna ang sintetikong datos pinaagi sa Syntho sa SAS Viya
  • Giaprobahan ang sintetikong pagkasibu sa datos, kay ang mga Modelo nga gibansay sa sintetikong marka sa datos susama sa mga modelo nga gibansay sa orihinal nga datos
  • gitagna namon ang pagkadaot ug pagkamatay sa sintetikong datos isip bahin sa panukiduki sa kanser
  • ug gipakita ang pagtaas sa AUC kung gihiusa ang sintetikong datos gikan sa daghang mga ospital.

Sunod nga mga lakang

Ang sunod nga mga lakang mao ang

  • naglakip sa dugang nga mga ospital
  • aron madugangan ang mga kaso sa paggamit ug
  • aron ipaabot sa bisan unsang ubang organisasyon, tungod kay ang mga teknik agnostiko sa sektor.

Mao kini ang paagi nga gi-unlock ni Syntho ug SAS ang mga datos ug nahibal-an ang mga datos nga gipatuyok sa mga panabut sa pag-atiman sa kahimsog aron masiguro nga ang pag-atiman sa kahimsog maayo ang kawani, nga adunay normal nga presyur aron maluwas ang mga kinabuhi.

Sintetikong Data sa tabon sa Panglawas

I-save ang imong sintetikong datos sa taho sa pag-atiman sa panglawas!