De Privateco al Eblo: Uzante Sintezajn Datumojn per la integra Syntho Engine en SAS Viya kiel parto de la SAS Hackathon por malŝlosi privatecajn sentemajn datumojn

Ni malŝlosas la plenan potencialon de sanaj datumoj per genera AI dum la SAS Hackathon.

Kial malŝlosi privatecajn sentemajn sanajn datumojn?

Sanservo forte bezonas datumojn pri sektoroj. Ĉar sanservo estas nesufiĉa, tro premata kun la potencialo savi vivojn. Tamen, sanaj datumoj estas la plej sentemaj datumoj pri privateco kaj tial estas ŝlositaj. Ĉi tiu privateca sentema datumoj:

  • Estas tempopostula aliri
  • Postulas ampleksan dokumentojn
  • Kaj ne povas simple esti uzata

Ĉi tio estas problema, ĉar nia celo por ĉi tiu hakatono estas antaŭdiri plimalboniĝon kaj mortecon kiel parto de kanceresplorado por gvida hospitalo. Tial Syntho kaj SAS kunlaboras por ĉi tiu hospitalo, kie Syntho malŝlosas datumojn per sintezaj datumoj kaj SAS realigas datumojn per SAS Viya, la ĉefa analiza platformo.

Sintezaj datumoj?

Nia Syntho Engine generas tute novajn artefarite generitajn datumojn. Ŝlosila diferenco, ni aplikas AI por imiti la karakterizaĵojn de realaj mondaj datumoj en la sintezaj datumoj, kaj ĝis tia grado, ke ĝi eĉ povas esti uzata por analizo. Tial ni nomas ĝin sinteza datumĝemelo. Ĝi estas same bona kiel reala kaj statistike identa al la originaj datumoj, sed sen la privatecaj riskoj.

Syntho Engine integrita en SAS Viya

Dum ĉi tiu hackathon, ni integris la Syntho Engine API en SAS Viya kiel paŝo. Ĉi tie ni ankaŭ validigis, ke la sintezaj datumoj ja estas same bonaj kiel realaj en SAS Viya. Antaŭ ol ni komencis kun la kanceresplorado, ni testis ĉi tiun integran aliron per malferma datumaro kaj konfirmis ĉu la sintezaj datumoj estas ja tiel bonaj kiel realaj per diversaj validigaj metodoj en SAS Viya.

Ĉu sintezaj datumoj estas same bonaj kiel realaj?

La korelacioj, la rilatoj inter variabloj, estas konservitaj.

La Areo Sub la kurbo, mezuro por modelefikeco, estas konservita.

Kaj eĉ la varia graveco, la prognoza potenco de variabloj por modelo, validas kiam ni komparas la originajn datumojn kun la sintezaj datumoj.

Tial, ni povas konkludi, ke sintezaj datumoj generitaj de la Syntho Engine en SAS Viya estas ja tiel bona kiel reala kaj ke ni povas uzi sintezajn datumojn por modelevoluo. Tial ni povas komenci per ĉi tiu kanceresplorado por antaŭdiri plimalboniĝon kaj mortecon.

Sintezaj datumoj por Kankro-Esplorado por gvida hospitalo

Ĉi tie, ni uzis la integran Syntho Engine kiel paŝon en SAS Viya por malŝlosi ĉi tiujn privatecajn sentemajn datumojn per sintezaj datumoj.

La rezulto, AUC de 0.74 kaj modelo kiu kapablas antaŭdiri difekton kaj mortecon.

Kiel rezulto de uzado de sintezaj datumoj, ni povis malŝlosi ĉi tiun kuracadon en situacio kun malpli da risko, pli da datumoj kaj pli rapida datuma aliro.

Kombinu datumojn de pluraj hospitaloj

Ĉi tio ne nur eblas ene de la hospitalo, ankaŭ datumoj de pluraj hospitaloj povus esti kombinitaj. Tial, la sekva paŝo estis sintezi datumojn de multoblaj hospitaloj. Malsamaj rilataj hospitaldatenoj estis sintezitaj kiel enigaĵo por la modelo en SAS Viya per la Syntho Engine. Ĉi tie, ni realigis AUC de 0.78, pruvante, ke pli da datumoj rezultigas pli bonan prognozan potencon de tiuj modeloj.

rezultoj

Kaj jen la rezultoj de ĉi tiu hakatono:

  • Syntho estas integrita en SAS Viya kiel paŝo
  • sintezaj datumoj estas sukcese generitaj per Syntho en SAS Viya
  • Sinteza datenprecizeco estas aprobita, ĉar modeloj trejnitaj sur sintezaj datenpoentaro similaj tiam modeloj trejnitaj sur originaj datenoj
  • ni antaŭdiris plimalboniĝon kaj mortecon de sintezaj datumoj kiel parto de kanceresplorado
  • kaj pruvis pliiĝon en AUC dum kombinado de sintezaj datenoj de multoblaj hospitaloj.

Sekvaj paŝoj

La sekvaj paŝoj estas al

  • inkluzivi pli da hospitaloj
  • etendi uzkazojn kaj
  • etendi al iu alia organizo, ĉar la teknikoj estas sektoraj agnostikaj.

Jen kiel Syntho kaj SAS malŝlosas datumojn kaj realigas datumajn komprenojn pri kuracado por certigi, ke sanservo estas bone ekipita, kun normala premo por savi vivojn.

Sintezaj Datumoj en Sanservo-kovrilo

Konservu viajn sintezajn datumojn en sanraporto!