Od prywatności do możliwości: wykorzystanie danych syntetycznych za pośrednictwem zintegrowanego silnika Syntho w SAS Viya w ramach SAS Hackathon w celu odblokowania poufnych danych

Odblokowujemy pełny potencjał danych medycznych dzięki generatywnej sztucznej inteligencji podczas SAS Hackathon.

Po co odblokowywać poufne dane dotyczące opieki zdrowotnej?

Opieka zdrowotna pilnie potrzebuje wglądu w dyski danych. Ponieważ opieka zdrowotna ma za mało personelu i jest pod presją możliwości ratowania życia. Jednak dane dotyczące opieki zdrowotnej są najbardziej wrażliwymi danymi dotyczącymi prywatności i dlatego są zablokowane. Te wrażliwe dane dotyczące prywatności:

  • Dostęp jest czasochłonny
  • Wymaga obszernej dokumentacji
  • I nie może być po prostu używany

Jest to problematyczne, ponieważ naszym celem w tym hackathonie jest przewidywanie pogorszenia stanu zdrowia i śmiertelności w ramach badań nad rakiem dla wiodącego szpitala. Dlatego Syntho i SAS współpracują w tym szpitalu, w którym Syntho odblokowuje dane za pomocą danych syntetycznych, a SAS realizuje wgląd w dane za pomocą SAS Viya, wiodącej platformy analitycznej.

Dane syntetyczne?

Nasz Syntho Engine generuje zupełnie nowe, sztucznie generowane dane. Kluczowa różnica polega na tym, że stosujemy sztuczną inteligencję, aby naśladować cechy rzeczywistych danych w danych syntetycznych i to w takim stopniu, że można je nawet wykorzystać do analiz. Dlatego nazywamy to syntetycznym bliźniakiem danych. Są tak dobre, jak prawdziwe i statystycznie identyczne z oryginalnymi danymi, ale bez ryzyka dla prywatności.

Silnik Syntho zintegrowany z SAS Viya

Podczas tego hackatonu jako krok zintegrowaliśmy API Syntho Engine z SAS Viya. Tutaj również potwierdziliśmy, że dane syntetyczne są rzeczywiście tak dobre, jak rzeczywiste w SAS Viya. Zanim rozpoczęliśmy badania nad rakiem, przetestowaliśmy to zintegrowane podejście z otwartym zbiorem danych i sprawdziliśmy, czy dane syntetyczne są rzeczywiście tak dobre, jak rzeczywiste, za pomocą różnych metod walidacji w SAS Viya.

Czy dane syntetyczne są równie dobre jak prawdziwe?

Korelacje, relacje między zmiennymi, są zachowane.

Obszar pod krzywą, miara wydajności modelu, zostaje zachowany.

I nawet znaczenie zmiennej, moc predykcyjna zmiennych dla modelu, zachowuje się, gdy porównujemy oryginalne dane z danymi syntetycznymi.

W związku z tym możemy stwierdzić, że dane syntetyczne generowane przez silnik Syntho w SAS Viya są rzeczywiście tak dobre, jak rzeczywiste i że możemy wykorzystać dane syntetyczne do opracowania modelu. Dlatego możemy zacząć od tych badań nad rakiem, aby przewidzieć pogorszenie i śmiertelność.

Syntetyczne dane dla Cancer Research dla wiodącego szpitala

Tutaj wykorzystaliśmy zintegrowany silnik Syntho jako krok w SAS Viya, aby odblokować te poufne dane za pomocą danych syntetycznych.

Wynik, AUC 0.74 i model, który jest w stanie przewidzieć pogorszenie i śmiertelność.

Dzięki wykorzystaniu danych syntetycznych udało nam się odblokować tę opiekę zdrowotną w sytuacji mniejszego ryzyka, większej ilości danych i szybszego dostępu do danych.

Połącz dane z wielu szpitali

Jest to możliwe nie tylko w obrębie szpitala, ale również dane z wielu szpitali mogą być łączone. Dlatego następnym krokiem była synteza danych z wielu szpitali. Różne istotne dane szpitalne zostały zsyntetyzowane jako dane wejściowe dla modelu w SAS Viya za pośrednictwem silnika Syntho. Tutaj osiągnęliśmy AUC 0.78, pokazując, że więcej danych skutkuje lepszą mocą predykcyjną tych modeli.

Efekt

A oto wyniki tego hackathonu:

  • Syntho jest zintegrowane z SAS Viya jako step
  • dane syntetyczne są pomyślnie generowane przez Syntho w SAS Viya
  • Dokładność danych syntetycznych została zatwierdzona, ponieważ modele wyszkolone na danych syntetycznych uzyskują wyniki podobne do modeli wyszkolonych na danych oryginalnych
  • przewidzieliśmy pogorszenie i śmiertelność na podstawie danych syntetycznych w ramach badań nad rakiem
  • i wykazał wzrost AUC podczas łączenia danych syntetycznych z wielu szpitali.

Następne kroki

Kolejne kroki to

  • obejmować więcej szpitali
  • rozszerzyć przypadki użycia i
  • rozszerzyć na każdą inną organizację, ponieważ techniki są niezależne od sektora.

W ten sposób Syntho i SAS odblokowują dane i realizują oparte na danych spostrzeżenia w opiece zdrowotnej, aby upewnić się, że opieka zdrowotna jest dobrze obsadzona, z normalną presją ratowania życia.

Dane syntetyczne w okładce opieki zdrowotnej

Zapisz swoje dane syntetyczne w raporcie medycznym!