Od soukromí k možnosti: Použití syntetických dat prostřednictvím integrovaného enginu Syntho v SAS Viya jako součásti SAS Hackathon k odemknutí dat citlivých na soukromí

Během SAS Hackathonu odemykáme plný potenciál zdravotnických dat pomocí generativní umělé inteligence.

Proč odemykat zdravotnická data citlivá na soukromí?

Zdravotnictví nutně potřebuje statistiky datových jednotek. Protože zdravotnictví je poddimenzované, přehnané tlakem na potenciál zachraňovat životy. Údaje o zdravotní péči jsou však nejcitlivějšími údaji o ochraně soukromí, a proto jsou uzamčeny. Tyto údaje citlivé na soukromí:

  • Přístup je časově náročný
  • Vyžaduje rozsáhlé papírování
  • A nedá se jednoduše použít

To je problematické, protože naším cílem pro tento hackathon je předpovídat zhoršení stavu a úmrtnost v rámci výzkumu rakoviny pro přední nemocnici. To je důvod, proč Syntho a SAS spolupracují pro tuto nemocnici, kde Syntho odemyká data pomocí syntetických dat a SAS realizuje pohledy na data pomocí SAS Viya, přední analytické platformy.

Syntetická data?

Náš Syntho Engine generuje zcela nová uměle generovaná data. Hlavním rozdílem je, že používáme umělou inteligenci k napodobování charakteristik reálných dat v syntetických datech, a to do takové míry, že ji lze dokonce použít pro analýzu. Proto tomu říkáme dvojče syntetických dat. Jsou stejně dobré jako skutečné a statisticky identické s původními údaji, ale bez rizik pro soukromí.

Syntho Engine integrovaný v SAS Viya

Během tohoto hackathonu jsme jako krok integrovali API Syntho Engine do SAS Viya. Zde jsme také potvrdili, že syntetická data jsou v SAS Viya skutečně stejně dobrá jako skutečná. Než jsme začali s výzkumem rakoviny, otestovali jsme tento integrovaný přístup s otevřeným souborem dat a pomocí různých validačních metod v SAS Viya jsme ověřili, zda jsou syntetická data skutečně stejně dobrá jako skutečná.

Jsou syntetická data stejně dobrá jako skutečná?

Korelace, vztahy mezi proměnnými, jsou zachovány.

Oblast pod křivkou, míra výkonu modelu, je zachována.

A dokonce i proměnná důležitost, prediktivní síla proměnných pro model, platí, když porovnáme původní data se syntetickými daty.

Můžeme tedy dojít k závěru, že syntetická data generovaná Syntho Engine v SAS Viya jsou skutečně stejně dobrá jako skutečná a že syntetická data můžeme použít pro vývoj modelu. Můžeme tedy začít s tímto výzkumem rakoviny, abychom předpověděli zhoršení stavu a úmrtnost.

Syntetická data pro výzkum rakoviny pro přední nemocnici

Zde jsme použili integrovaný Syntho Engine jako krok v SAS Viya k odemknutí těchto citlivých dat pomocí syntetických dat.

Výsledkem je AUC 0.74 a model, který je schopen předpovědět zhoršení a mortalitu.

Díky použití syntetických dat jsme byli schopni odemknout tuto zdravotní péči v situaci s menším rizikem, více daty a rychlejším přístupem k datům.

Kombinujte data z více nemocnic

To není možné pouze v rámci nemocnice, lze také kombinovat data z více nemocnic. Dalším krokem tedy bylo syntetizovat data z více nemocnic. Různá relevantní nemocniční data byla syntetizována jako vstup pro model v SAS Viya prostřednictvím Syntho Engine. Zde jsme si uvědomili AUC 0.78, což dokazuje, že více dat vede k lepší prediktivní schopnosti těchto modelů.

výsledky

A toto jsou výsledky tohoto hackathonu:

  • Syntho je integrován do SAS Viya jako krok
  • syntetická data jsou úspěšně generována přes Syntho v SAS Viya
  • Přesnost syntetických dat je schválena, protože modely trénované na syntetických datech mají podobné skóre jako modely trénované na původních datech
  • předpověděli jsme zhoršení a mortalitu na syntetických datech v rámci výzkumu rakoviny
  • a prokázal zvýšení AUC při kombinaci syntetických dat z více nemocnic.

Další kroky

Další kroky jsou k

  • zahrnout více nemocnic
  • rozšířit případy použití a
  • rozšířit na jakoukoli jinou organizaci, protože techniky jsou sektorově agnostické.

Takto Syntho a SAS odemykají data a realizují daty řízené poznatky ve zdravotnictví, aby se ujistil, že zdravotní péče je dobře personálně zajištěna, s normálním tlakem na záchranu životů.

Syntetická data v krytu zdravotnictví

Uložte si syntetická data do zdravotnické zprávy!