ગોપનીયતાથી સંભાવના સુધી: ગોપનીયતા સંવેદનશીલ ડેટાને અનલૉક કરવા માટે SAS હેકાથોનના ભાગ રૂપે SAS Viya માં સંકલિત સિન્થો એન્જિન દ્વારા સિન્થેટિક ડેટાનો ઉપયોગ

અમે SAS હેકાથોન દરમિયાન જનરેટિવ AI સાથે હેલ્થકેર ડેટાની સંપૂર્ણ સંભાવનાને અનલૉક કરીએ છીએ.

પ્રાઇવસી સેન્સિટિવ હેલ્થકેર ડેટાને શા માટે અનલૉક કરવો?

હેલ્થકેરને ડેટા ડ્રાઇવ આંતરદૃષ્ટિની સખત જરૂર છે. કારણ કે આરોગ્યસંભાળમાં સ્ટાફ ઓછો છે, જીવન બચાવવાની સંભાવના સાથે વધુ દબાણ છે. જો કે, હેલ્થકેર ડેટા સૌથી ગોપનીયતા સંવેદનશીલ ડેટા છે અને તેથી તેને લૉક કરવામાં આવે છે. આ ગોપનીયતા સંવેદનશીલ ડેટા:

  • ઍક્સેસ કરવા માટે સમય માંગી લે છે
  • વ્યાપક કાગળની જરૂર છે
  • અને ફક્ત ઉપયોગ કરી શકાતો નથી

આ સમસ્યારૂપ છે, કારણ કે આ હેકાથોન માટેનો અમારો ધ્યેય અગ્રણી હોસ્પિટલ માટે કેન્સર સંશોધનના ભાગરૂપે બગાડ અને મૃત્યુદરની આગાહી કરે છે. તેથી જ સિન્થો અને SAS આ હોસ્પિટલ માટે સહયોગ કરે છે, જ્યાં સિન્થો સિન્થેટિક ડેટા સાથે ડેટાને અનલૉક કરે છે અને SAS, SAS Viya, અગ્રણી એનાલિટિક્સ પ્લેટફોર્મ સાથે ડેટાની આંતરદૃષ્ટિ અનુભવે છે.

કૃત્રિમ ડેટા?

અમારું સિન્થો એન્જિન સંપૂર્ણપણે નવો કૃત્રિમ રીતે જનરેટ થયેલ ડેટા જનરેટ કરે છે. મુખ્ય તફાવત, અમે કૃત્રિમ ડેટામાં વાસ્તવિક વિશ્વના ડેટાની લાક્ષણિકતાઓની નકલ કરવા માટે AI લાગુ કરીએ છીએ, અને એટલી હદે કે તેનો ઉપયોગ એનાલિટિક્સ માટે પણ થઈ શકે છે. તેથી જ આપણે તેને સિન્થેટિક ડેટા ટ્વીન કહીએ છીએ. તે વાસ્તવિક અને આંકડાકીય રીતે મૂળ ડેટા જેટલું જ સારું છે, પરંતુ ગોપનીયતાના જોખમો વિના.

SAS Viya માં સંકલિત સિન્થો એન્જિન

આ હેકાથોન દરમિયાન, અમે SAS Viya માં Syntho Engine API ને સ્ટેપ તરીકે એકીકૃત કર્યું છે. અહીં અમે એ પણ માન્ય કર્યું છે કે SAS Viya માં સિન્થેટીક ડેટા ખરેખર વાસ્તવિક જેટલો સારો છે. અમે કેન્સર સંશોધન સાથે પ્રારંભ કરીએ તે પહેલાં, અમે આ સંકલિત અભિગમને એક ઓપન ડેટાસેટ સાથે ચકાસ્યો અને SAS Viya માં વિવિધ માન્યતા પદ્ધતિઓ દ્વારા સિન્થેટિક ડેટા ખરેખર-સાચો-સાચો છે કે કેમ તેની પુષ્ટિ કરી.

શું કૃત્રિમ ડેટા વાસ્તવિક જેટલો સારો છે?

સહસંબંધો, ચલો વચ્ચેના સંબંધો, સચવાય છે.

વળાંક હેઠળનો વિસ્તાર, મોડેલ પ્રદર્શન માટેનું માપ, સાચવેલ છે.

અને જ્યારે આપણે મૂળ ડેટાની સિન્થેટીક ડેટા સાથે સરખામણી કરીએ છીએ ત્યારે ચલ મહત્વ પણ, મોડેલ માટે ચલોની આગાહી શક્તિ ધરાવે છે.

આથી, અમે નિષ્કર્ષ પર આવી શકીએ છીએ કે SAS વિયામાં સિન્થો એન્જિન દ્વારા જનરેટ કરવામાં આવેલ સિન્થેટિક ડેટા ખરેખર-સાચો-વાસ્તવિક છે અને અમે મોડેલ ડેવલપમેન્ટ માટે સિન્થેટિક ડેટાનો ઉપયોગ કરી શકીએ છીએ. આથી, આપણે બગાડ અને મૃત્યુદરની આગાહી કરવા માટે આ કેન્સર સંશોધનથી શરૂ કરી શકીએ છીએ.

અગ્રણી હોસ્પિટલ માટે કેન્સર સંશોધન માટે સિન્થેટિક ડેટા

અહીં, અમે સિન્થેટિક ડેટા સાથે આ ગોપનીયતા સંવેદનશીલ ડેટાને અનલૉક કરવા માટે SAS Viya માં પગલા તરીકે સંકલિત સિન્થો એન્જિનનો ઉપયોગ કર્યો છે.

પરિણામ, 0.74 નું AUC અને એક મોડેલ જે બગાડ અને મૃત્યુદરની આગાહી કરવામાં સક્ષમ છે.

સિન્થેટિક ડેટાનો ઉપયોગ કરવાના પરિણામે, અમે ઓછા જોખમ, વધુ ડેટા અને ઝડપી ડેટા એક્સેસ સાથેની પરિસ્થિતિમાં આ હેલ્થકેરને અનલૉક કરવામાં સક્ષમ હતા.

બહુવિધ હોસ્પિટલોના ડેટાને જોડો

આ માત્ર હોસ્પિટલમાં જ શક્ય નથી, બહુવિધ હોસ્પિટલોના ડેટાને પણ જોડી શકાય છે. તેથી, આગળનું પગલું બહુવિધ હોસ્પિટલોમાંથી ડેટાનું સંશ્લેષણ કરવાનું હતું. સિન્થો એન્જિન દ્વારા SAS વિયામાં મોડેલ માટે ઇનપુટ તરીકે વિવિધ સંબંધિત હોસ્પિટલ ડેટાનું સંશ્લેષણ કરવામાં આવ્યું હતું. અહીં, અમે 0.78 નું AUC અનુભવ્યું, જે દર્શાવે છે કે વધુ ડેટા તે મોડેલોની વધુ સારી આગાહી શક્તિમાં પરિણમે છે.

પરિણામો

અને આ હેકાથોનનાં પરિણામો છે:

  • સિન્થો સ્ટેપ તરીકે SAS Viya માં એકીકૃત છે
  • SAS Viya માં સિન્થો દ્વારા સિન્થેટિક ડેટા સફળતાપૂર્વક જનરેટ થાય છે
  • સિન્થેટિક ડેટાની ચોકસાઈ મંજૂર છે, કારણ કે સિન્થેટિક ડેટા સ્કોર પર પ્રશિક્ષિત મૉડલ્સ અસલ ડેટા પર પ્રશિક્ષિત મૉડલ્સ સમાન છે.
  • અમે કેન્સર સંશોધનના ભાગ રૂપે સિન્થેટીક ડેટા પર બગાડ અને મૃત્યુદરની આગાહી કરી છે
  • અને બહુવિધ હોસ્પિટલોના કૃત્રિમ ડેટાને સંયોજિત કરતી વખતે એયુસીમાં વધારો દર્શાવે છે.

આગામી પગલાં

આગળનાં પગલાં છે

  • વધુ હોસ્પિટલોનો સમાવેશ થાય છે
  • ઉપયોગના કેસોને વિસ્તારવા અને
  • કોઈપણ અન્ય સંસ્થા સુધી વિસ્તારવા માટે, કારણ કે તકનીકો સેક્ટર અજ્ઞેયવાદી છે.

આ રીતે સિન્થો અને SAS ડેટાને અનલૉક કરે છે અને આરોગ્યસંભાળમાં ડેટા આધારિત આંતરદૃષ્ટિનો અનુભવ કરે છે તેની ખાતરી કરવા માટે કે આરોગ્યસંભાળ સારી રીતે સ્ટાફ છે, જીવન બચાવવા માટે સામાન્ય દબાણ સાથે.

હેલ્થકેર કવરમાં સિન્થેટિક ડેટા

હેલ્થકેર રિપોર્ટમાં તમારો સિન્થેટિક ડેટા સાચવો!