Vun Privatsphär op Méiglechkeet: Synthetesch Donnéeën iwwer den integréierte Syntho Engine am SAS Viya als Deel vum SAS Hackathon benotzen fir Privatsphärempfindlech Donnéeën ze spären

Mir spären dat vollt Potenzial vu Gesondheetsdaten mat generativen AI wärend dem SAS Hackathon op.

Firwat Privatsphär sensibel Gesondheetsdaten opmaachen?

D'Gesondheetsariichtung brauch streng Datenfuerer Abléck. Well d'Gesondheetsariichtung ënnerbemannt ass, iwwerdrockt mam Potenzial fir Liewen ze retten. Wéi och ëmmer, Gesondheetsdaten sinn déi meescht Privatsphär sensibel Donnéeën an sinn dofir gespaart. Dës Privatsphär sensibel Donnéeën:

  • Ass Zäit-opwänneg Zougang
  • Verlaangt extensiv Pabeieren
  • A kann net einfach benotzt ginn

Dëst ass problematesch, well eist Zil fir dësen Hackathon ass d'Verschlechterung an d'Mortalitéit virauszesoen als Deel vu Kriibsfuerschung fir e féierende Spidol. Dofir kollaboréieren Syntho a SAS fir dëst Spidol, wou Syntho Daten mat syntheteschen Donnéeën opspäert an SAS Daten Abléck mat SAS Viya, der féierender analytesch Plattform realiséiert.

Synthetesch Daten?

Eis Syntho Engine generéiert komplett nei kënschtlech generéiert Donnéeën. Schlësselunterscheed, mir applizéieren AI fir d'Charakteristike vun realen Weltdaten an de syntheteschen Donnéeën ze mimikéieren, an esou engem Ausmooss datt et souguer fir Analyse benotzt ka ginn. Dofir nenne mir et e syntheteschen Date-Zwilling. Et ass sou gutt wéi real a statistesch identesch mat den originelle Donnéeën, awer ouni Privatsphär Risiken.

Syntho Engine integréiert an SAS Viya

Wärend dësem Hackathon hu mir de Syntho Engine API an SAS Viya als Schrëtt integréiert. Hei hu mir och validéiert datt déi synthetesch Donnéeën wierklech sou gutt wéi real an SAS Viya sinn. Ier mir mat der Kriibsfuerschung ugefaang hunn, hu mir dës integréiert Approche mat engem oppenen Dataset getest a validéiert ob déi synthetesch Donnéeën iwwer verschidde Validatiounsmethoden an SAS Viya wierklech sou gutt wéi real sinn.

Sinn synthetesch Daten esou gutt wéi real?

D'Korrelatiounen, d'Relatiounen tëscht Variabelen, sinn erhale bleiwen.

D'Gebitt Ënnert der Kurve, eng Moossnam fir d'Performance vum Modell, ass bewahrt.

An och déi variabel Wichtegkeet, d'predictive Kraaft vu Variablen fir e Modell, hält wa mir d'Originaldaten mat de syntheteschen Daten vergläichen.

Dofir kënne mir ofschléissen datt synthetesch Donnéeën generéiert vum Syntho Engine zu SAS Viya wierklech sou gutt wéi real sinn an datt mir synthetesch Donnéeën fir Modellentwécklung benotze kënnen. Dofir kënne mir mat dëser Kriibsfuerschung ufänken fir Verschlechterung a Mortalitéit virauszesoen.

Synthetesch Donnéeën fir Cancer Research fir e féierende Spidol

Hei hu mir den integréierte Syntho Engine als Schrëtt am SAS Viya benotzt fir dës Privatsphärsensibel Donnéeën mat syntheteschen Daten opzemaachen.

D'Resultat, en AUC vun 0.74 an e Modell dee fäeg ass Verschlechterung a Mortalitéit virauszesoen.

Als Resultat vun der Benotzung vun syntheteschen Daten, konnte mir dës Gesondheetsariichtung an enger Situatioun mat manner Risiko, méi Daten a méi séier Datezougang opmaachen.

Kombinéiert Daten aus verschidde Spideeler

Dëst ass net nëmmen am Spidol méiglech, och Daten aus e puer Spideeler kéinte kombinéiert ginn. Dofir war de nächste Schrëtt d'Date vu multiple Spideeler ze synthetiséieren. Verschidde relevant Spidoldaten goufen als Input fir de Modell am SAS Viya iwwer de Syntho Engine synthetiséiert. Hei hu mir en AUC vun 0.78 realiséiert, wat beweist datt méi Daten zu enger besserer Prévisiounskraaft vun dëse Modeller resultéieren.

Resultater

An dëst sinn d'Resultater vun dësem Hackathon:

  • Syntho ass an SAS Viya als Schrëtt integréiert
  • synthetesch Donnéeën ginn erfollegräich iwwer Syntho an SAS Viya generéiert
  • Synthetesch Date Genauegkeet ass guttgeheescht, well Modeller trainéiert op syntheteschen Daten Score ähnlech wéi Modeller trainéiert op originell Daten
  • mir virausgesot Verschlechterung an veruerteelt op syntheteschen Donnéeën als Deel vun Kriibs Fuerschung
  • a bewisen Erhéijung vun AUC wann syntheteschen Daten aus MÉI Spideeler kombinéiert.

Nächst Schrëtt

Déi nächst Schrëtt sinn ze

  • méi Spideeler enthalen
  • benotzen Fäll ze verlängeren an
  • fir all aner Organisatioun ze verlängeren, well d'Techniken Secteur agnostesch sinn.

Dëst ass wéi Syntho an SAS Daten opspären an daten ugedriwwen Abléck an der Gesondheetsariichtung realiséieren fir sécher ze stellen datt d'Gesondheetsariichtung gutt bemannt ass, mat normalen Drock fir Liewen ze retten.

Synthetesch Donnéeën am Gesondheetsversuergung Cover

Späichert Är synthetesch Donnéeën am Gesondheetsbericht!