Od súkromia k možnosti: Používanie syntetických údajov cez integrovaný Syntho Engine v SAS Viya ako súčasť SAS Hackathon na odomknutie údajov citlivých na súkromie

Počas SAS Hackathonu odomykáme plný potenciál údajov o zdravotnej starostlivosti pomocou generatívnej AI.

Prečo odomknúť údaje o zdravotnej starostlivosti citlivé na súkromie?

Zdravotníctvo veľmi potrebuje prehľad dátových jednotiek. Pretože zdravotná starostlivosť je poddimenzovaná a pod tlakom potenciálu zachraňovať životy. Údaje o zdravotnej starostlivosti sú však najcitlivejšie na súkromie, a preto sú uzamknuté. Tieto údaje citlivé na súkromie:

  • Prístup je časovo náročný
  • Vyžaduje rozsiahle papierovanie
  • A nedá sa jednoducho použiť

To je problematické, keďže naším cieľom pre tento hackathon je predpovedať zhoršenie stavu a úmrtnosť v rámci výskumu rakoviny pre poprednú nemocnicu. To je dôvod, prečo Syntho a SAS spolupracujú pre túto nemocnicu, kde Syntho odomyká údaje pomocou syntetických údajov a SAS realizuje prehľad údajov pomocou SAS Viya, poprednej analytickej platformy.

Syntetické dáta?

Náš Syntho Engine generuje úplne nové umelo generované dáta. Hlavným rozdielom je, že umelú inteligenciu používame na napodobňovanie charakteristík údajov z reálneho sveta v syntetických údajoch, a to do takej miery, že ich možno použiť aj na analýzu. Preto to nazývame dvojča syntetických údajov. Sú rovnako dobré ako skutočné a štatisticky identické s pôvodnými údajmi, ale bez rizika ochrany súkromia.

Syntho Engine integrovaný v SAS Viya

Počas tohto hackathonu sme ako krok integrovali API Syntho Engine do SAS Viya. Tu sme tiež potvrdili, že syntetické údaje sú skutočne také dobré ako skutočné v SAS Viya. Predtým, ako sme začali s výskumom rakoviny, otestovali sme tento integrovaný prístup s otvoreným súborom údajov a overili sme, či sú syntetické údaje skutočne také dobré ako skutočné, prostredníctvom rôznych metód validácie v SAS Viya.

Sú syntetické údaje rovnako dobré ako skutočné?

Korelácie, vzťahy medzi premennými, sú zachované.

Oblasť pod krivkou, miera výkonu modelu, sa zachová.

A dokonca aj premenná dôležitosť, prediktívna sila premenných pre model, platí, keď porovnávame pôvodné údaje so syntetickými údajmi.

Môžeme teda dospieť k záveru, že syntetické dáta generované Syntho Engine v SAS Viya sú skutočne rovnako dobré ako skutočné a že syntetické dáta môžeme použiť na vývoj modelu. Preto môžeme začať s týmto výskumom rakoviny, aby sme predpovedali zhoršenie stavu a úmrtnosť.

Syntetické údaje pre výskum rakoviny pre poprednú nemocnicu

Tu sme použili integrovaný Syntho Engine ako krok v SAS Viya na odomknutie týchto údajov citlivých na súkromie pomocou syntetických údajov.

Výsledkom je AUC 0.74 a model, ktorý je schopný predpovedať zhoršenie stavu a mortalitu.

Vďaka použitiu syntetických údajov sme dokázali odomknúť túto zdravotnú starostlivosť v situácii s menším rizikom, väčším množstvom údajov a rýchlejším prístupom k údajom.

Skombinujte údaje z viacerých nemocníc

Nie je to možné len v rámci nemocnice, je možné kombinovať aj údaje z viacerých nemocníc. Ďalším krokom bolo preto syntetizovať údaje z viacerých nemocníc. Rôzne relevantné nemocničné údaje boli syntetizované ako vstup pre model v SAS Viya prostredníctvom Syntho Engine. Tu sme si uvedomili AUC 0.78, čo dokazuje, že viac údajov vedie k lepšej prediktívnej sile týchto modelov.

výsledky

A toto sú výsledky tohto hackathonu:

  • Syntho je integrovaný do SAS Viya ako krok
  • syntetické dáta sú úspešne generované cez Syntho v SAS Viya
  • Presnosť syntetických údajov je schválená, pretože modely trénované na syntetických údajoch dosahujú podobné skóre ako modely trénované na pôvodných údajoch
  • predpovedali sme zhoršenie stavu a úmrtnosť na syntetických údajoch v rámci výskumu rakoviny
  • a preukázali zvýšenie AUC pri kombinovaní syntetických údajov z viacerých nemocníc.

Ďalšie kroky

Ďalšie kroky smerujú k

  • zahrnúť viac nemocníc
  • rozšíriť prípady použitia a
  • rozšíriť na akúkoľvek inú organizáciu, keďže techniky sú sektorovo agnostické.

Takto Syntho a SAS odomykajú údaje a realizujú poznatky v oblasti zdravotnej starostlivosti založené na údajoch, aby sa zabezpečilo, že zdravotná starostlivosť je dobre personálne vybavená, s normálnym tlakom na záchranu životov.

Syntetické údaje v kryte zdravotnej starostlivosti

Uložte svoje syntetické údaje do správy o zdravotnej starostlivosti!