Құпиялылықтан мүмкіндікке дейін: құпиялылықты қажет ететін деректердің құлпын ашу үшін SAS Hackathon бағдарламасының бөлігі ретінде SAS Viya жүйесіндегі біріктірілген Syntho қозғалтқышы арқылы синтетикалық деректерді пайдалану

SAS Hackathon кезінде генеративті AI көмегімен денсаулық сақтау деректерінің толық әлеуетін ашамыз.

Неліктен құпиялылыққа сезімтал денсаулық сақтау деректерінің құлпын ашу керек?

Денсаулық сақтау саласы деректерге негізделген түсініктерді қажет етеді. Өйткені денсаулық сақтау саласы кадрлармен қамтамасыз етілмегендіктен, адам өмірін сақтап қалу мүмкіндігі тым жоғары. Дегенмен, денсаулық сақтау деректері құпиялылыққа қатысты ең маңызды деректер болып табылады және сондықтан құлыпталады. Бұл құпиялылық құпия деректер:

  • Қол жеткізу уақытты қажет етеді
  • Үлкен құжатты қажет етеді
  • Және жай ғана қолдануға болмайды

Бұл проблемалық, өйткені бұл хакатондағы мақсатымыз жетекші аурухана үшін онкологиялық зерттеулердің бөлігі ретінде нашарлау мен өлімді болжау. Сондықтан Syntho және SAS осы аурухана үшін ынтымақтасады, мұнда Syntho синтетикалық деректермен деректерді ашады және SAS жетекші аналитикалық платформасы SAS Viya көмегімен деректер туралы түсініктерді жүзеге асырады.

Синтетикалық деректер?

Біздің Syntho қозғалтқышымыз жасанды түрде жасалған мүлдем жаңа деректерді жасайды. Негізгі айырмашылық, біз синтетикалық деректердегі нақты дүние деректерінің сипаттамаларын имитациялау үшін AI қолданамыз және оны тіпті аналитика үшін де қолдануға болады. Сондықтан біз оны синтетикалық деректер егізі деп атаймыз. Ол шынайы және статистикалық түрде бастапқы деректермен бірдей, бірақ құпиялылыққа қауіп төндірмейді.

SAS Viya жүйесіне біріктірілген Syntho қозғалтқышы

Осы хакатон кезінде біз қадам ретінде SAS Viya жүйесіне Syntho Engine API біріктірдік. Мұнда біз синтетикалық деректердің SAS Viya-да шынайы сияқты жақсы екенін де растадық. Қатерлі ісік ауруын зерттеуді бастамас бұрын, біз бұл біріктірілген тәсілді ашық деректер жиынтығымен сынап көрдік және SAS Viya-дағы әртүрлі валидация әдістері арқылы синтетикалық деректер шынымен де шынайы екенін тексердік.

Синтетикалық деректер шынайы ма?

Корреляциялар, айнымалылар арасындағы қатынастар сақталады.

Үлгі өнімділігіне арналған өлшем қисық астындағы аумақ сақталады.

Тіпті айнымалы маңыздылығы, модель үшін айнымалылардың болжамдық күші бастапқы деректерді синтетикалық деректермен салыстырған кезде сақталады.

Демек, SAS Viya жүйесіндегі Syntho қозғалтқышы жасаған синтетикалық деректер шынымен де шынайы және синтетикалық деректерді модельді әзірлеу үшін пайдалана аламыз деген қорытынды жасауға болады. Демек, біз нашарлау мен өлімді болжау үшін осы қатерлі ісік зерттеуінен бастай аламыз.

Жетекші аурухана үшін Cancer Research үшін синтетикалық деректер

Мұнда біз синтетикалық деректермен құпиялылықты маңызды деректердің құлпын ашу үшін SAS Viya қадамы ретінде біріктірілген Syntho қозғалтқышын қолдандық.

Нәтижесінде, AUC 0.74 және нашарлау мен өлімді болжауға қабілетті модель.

Синтетикалық деректерді пайдалану нәтижесінде біз бұл денсаулық сақтауды тәуекелі аз, деректері көп және деректерге жылдам қол жеткізу жағдайында аша алдық.

Бірнеше ауруханадан алынған деректерді біріктіріңіз

Бұл тек аурухана ішінде ғана мүмкін емес, сонымен қатар бірнеше ауруханалардың деректерін біріктіруге болады. Осылайша, келесі қадам бірнеше ауруханалардың деректерін синтездеу болды. Түрлі тиісті аурухана деректері Syntho қозғалтқышы арқылы SAS Viya үлгісіне кіріс ретінде синтезделді. Мұнда біз 0.78 AUC мәнін түсіндік, бұл деректердің көп болуы сол үлгілердің болжамдық күшін жақсартатынын көрсетті.

нәтижелері

Бұл хакатонның нәтижелері:

  • Syntho SAS Viya жүйесіне қадам ретінде біріктірілген
  • синтетикалық деректер SAS Viya жүйесінде Syntho арқылы сәтті жасалды
  • Синтетикалық деректердің дәлдігі мақұлданды, өйткені синтетикалық деректер бойынша дайындалған модельдер бастапқы деректерге үйретілген үлгілерге ұқсас ұпай жинайды.
  • біз онкологиялық зерттеулердің бөлігі ретінде синтетикалық деректер бойынша нашарлау мен өлімді болжадық
  • және бірнеше ауруханалардан алынған синтетикалық деректерді біріктіру кезінде AUC жоғарылауын көрсетті.

Келесі қадамдар

Келесі қадамдар

  • көбірек ауруханаларды қамтиды
  • пайдалану жағдайларын кеңейту және
  • әдістер секторлық агностикалық болғандықтан, кез келген басқа ұйымға таралады.

Осылайша Syntho және SAS деректердің құлпын ашады және денсаулық сақтау саласы жақсы қызметкерлермен қамтамасыз етілгеніне және өмірді сақтап қалу үшін қалыпты қысымға көз жеткізу үшін денсаулық сақтау саласындағы деректерге негізделген түсініктерді жүзеге асырады.

Денсаулық сақтау мұқабасындағы синтетикалық деректер

Синтетикалық деректеріңізді денсаулық сақтау есебінде сақтаңыз!