Počas SAS Hackathonu odomykáme plný potenciál údajov o zdravotnej starostlivosti pomocou generatívnej AI.
Zdravotníctvo veľmi potrebuje prehľad dátových jednotiek. Pretože zdravotná starostlivosť je poddimenzovaná a pod tlakom potenciálu zachraňovať životy. Údaje o zdravotnej starostlivosti sú však najcitlivejšie na súkromie, a preto sú uzamknuté. Tieto údaje citlivé na súkromie:
To je problematické, keďže naším cieľom pre tento hackathon je predpovedať zhoršenie stavu a úmrtnosť v rámci výskumu rakoviny pre poprednú nemocnicu. To je dôvod, prečo Syntho a SAS spolupracujú pre túto nemocnicu, kde Syntho odomyká údaje pomocou syntetických údajov a SAS realizuje prehľad údajov pomocou SAS Viya, poprednej analytickej platformy.
Náš Syntho Engine generuje úplne nové umelo generované dáta. Hlavným rozdielom je, že umelú inteligenciu používame na napodobňovanie charakteristík údajov z reálneho sveta v syntetických údajoch, a to do takej miery, že ich možno použiť aj na analýzu. Preto to nazývame dvojča syntetických údajov. Sú rovnako dobré ako skutočné a štatisticky identické s pôvodnými údajmi, ale bez rizika ochrany súkromia.
Počas tohto hackathonu sme ako krok integrovali API Syntho Engine do SAS Viya. Tu sme tiež potvrdili, že syntetické údaje sú skutočne také dobré ako skutočné v SAS Viya. Predtým, ako sme začali s výskumom rakoviny, otestovali sme tento integrovaný prístup s otvoreným súborom údajov a overili sme, či sú syntetické údaje skutočne také dobré ako skutočné, prostredníctvom rôznych metód validácie v SAS Viya.
Korelácie, vzťahy medzi premennými, sú zachované.
Oblasť pod krivkou, miera výkonu modelu, sa zachová.
A dokonca aj premenná dôležitosť, prediktívna sila premenných pre model, platí, keď porovnávame pôvodné údaje so syntetickými údajmi.
Môžeme teda dospieť k záveru, že syntetické dáta generované Syntho Engine v SAS Viya sú skutočne rovnako dobré ako skutočné a že syntetické dáta môžeme použiť na vývoj modelu. Preto môžeme začať s týmto výskumom rakoviny, aby sme predpovedali zhoršenie stavu a úmrtnosť.
Tu sme použili integrovaný Syntho Engine ako krok v SAS Viya na odomknutie týchto údajov citlivých na súkromie pomocou syntetických údajov.
Výsledkom je AUC 0.74 a model, ktorý je schopný predpovedať zhoršenie stavu a mortalitu.
Vďaka použitiu syntetických údajov sme dokázali odomknúť túto zdravotnú starostlivosť v situácii s menším rizikom, väčším množstvom údajov a rýchlejším prístupom k údajom.
Nie je to možné len v rámci nemocnice, je možné kombinovať aj údaje z viacerých nemocníc. Ďalším krokom bolo preto syntetizovať údaje z viacerých nemocníc. Rôzne relevantné nemocničné údaje boli syntetizované ako vstup pre model v SAS Viya prostredníctvom Syntho Engine. Tu sme si uvedomili AUC 0.78, čo dokazuje, že viac údajov vedie k lepšej prediktívnej sile týchto modelov.
A toto sú výsledky tohto hackathonu:
Ďalšie kroky smerujú k
Takto Syntho a SAS odomykajú údaje a realizujú poznatky v oblasti zdravotnej starostlivosti založené na údajoch, aby sa zabezpečilo, že zdravotná starostlivosť je dobre personálne vybavená, s normálnym tlakom na záchranu životov.