კონფიდენციალურობიდან შესაძლებლობამდე: სინთეტიკური მონაცემების გამოყენება ინტეგრირებული Syntho Engine SAS Viya-ში, როგორც SAS Hackathon-ის ნაწილი, კონფიდენციალურობის მგრძნობიარე მონაცემების განსაბლოკად

ჩვენ ვხსნით ჯანდაცვის მონაცემების სრულ პოტენციალს გენერაციული AI-ით SAS Hackathon-ის დროს.

რატომ განბლოკეთ კონფიდენციალურობის მგრძნობიარე ჯანდაცვის მონაცემები?

ჯანდაცვას სერიოზულად სჭირდება მონაცემთა დისკზე ინფორმაციის მიწოდება. იმის გამო, რომ ჯანდაცვა არასაკმარისია, მეტი ზეწოლა აქვს სიცოცხლის გადარჩენის პოტენციალს. თუმცა, ჯანდაცვის მონაცემები არის ყველაზე მგრძნობიარე მონაცემები კონფიდენციალურობისთვის და, შესაბამისად, დაბლოკილია. ეს კონფიდენციალურობის მგრძნობიარე მონაცემები:

  • წვდომას დრო სჭირდება
  • მოითხოვს ვრცელ დოკუმენტაციას
  • და უბრალოდ გამოყენება არ შეიძლება

ეს პრობლემატურია, რადგან ჩვენი მიზანი ამ ჰაკათონის გაუარესებისა და სიკვდილიანობის პროგნოზირებაა, როგორც კიბოს კვლევის ნაწილი წამყვანი საავადმყოფოსთვის. სწორედ ამიტომ Syntho და SAS თანამშრომლობენ ამ საავადმყოფოსთვის, სადაც Syntho ხსნის მონაცემებს სინთეზური მონაცემებით და SAS ახორციელებს მონაცემთა ანალიზს SAS Viya-სთან, ანალიტიკური წამყვანი პლატფორმით.

სინთეტიკური მონაცემები?

ჩვენი Syntho Engine წარმოქმნის სრულიად ახალ ხელოვნურად გენერირებულ მონაცემებს. ძირითადი განსხვავება, ჩვენ ვიყენებთ AI-ს, რათა მივბაძოთ რეალურ სამყაროში არსებული მონაცემების მახასიათებლებს სინთეზურ მონაცემებში და იმდენად, რომ ის შეიძლება გამოყენებულ იქნას ანალიტიკისთვისაც კი. ამიტომ მას ვუწოდებთ სინთეზურ მონაცემთა ტყუპს. ის ისეთივე კარგია, როგორც რეალური და სტატისტიკურად იდენტურია თავდაპირველ მონაცემებთან, მაგრამ კონფიდენციალურობის რისკების გარეშე.

Syntho Engine ინტეგრირებული SAS Viya-ში

ამ ჰაკათონის დროს ჩვენ გავაერთიანეთ Syntho Engine API SAS Viya-ში, როგორც ნაბიჯი. აქ ჩვენ ასევე დავადასტურეთ, რომ სინთეზური მონაცემები მართლაც ისეთივე კარგია, როგორც რეალური SAS Viya-ში. სანამ კიბოს კვლევას დავიწყებდით, ჩვენ გამოვცადეთ ეს ინტეგრირებული მიდგომა ღია მონაცემთა ნაკრებით და დავადასტურეთ, არის თუ არა სინთეზური მონაცემები მართლაც ისეთივე კარგი, როგორც რეალური SAS Viya-ში ვალიდაციის სხვადასხვა მეთოდით.

არის თუ არა სინთეზური მონაცემები ისეთივე კარგი, როგორც რეალური?

შენარჩუნებულია კორელაციები, ურთიერთობები ცვლადებს შორის.

მრუდის ქვეშ არსებული ფართობი, მოდელის მუშაობის საზომი, შენარჩუნებულია.

და ცვლადის მნიშვნელობაც კი, მოდელისთვის ცვლადების პროგნოზირებადი ძალაა, როდესაც ჩვენ შევადარებთ ორიგინალურ მონაცემებს სინთეტიკურ მონაცემებს.

აქედან გამომდინარე, შეგვიძლია დავასკვნათ, რომ SAS Viya-ში Syntho Engine-ის მიერ გენერირებული სინთეზური მონაცემები მართლაც ისეთივე კარგია, როგორც რეალური და რომ ჩვენ შეგვიძლია გამოვიყენოთ სინთეზური მონაცემები მოდელის განვითარებისთვის. აქედან გამომდინარე, ჩვენ შეგვიძლია დავიწყოთ კიბოს ამ გამოკვლევით გაუარესების და სიკვდილიანობის პროგნოზირება.

სინთეზური მონაცემები კიბოს კვლევისთვის წამყვანი საავადმყოფოსთვის

აქ, ჩვენ გამოვიყენეთ ინტეგრირებული Syntho Engine, როგორც ნაბიჯი SAS Viya-ში, რათა განვბლოკოთ ეს კონფიდენციალურობის მგრძნობიარე მონაცემები სინთეტიკური მონაცემებით.

შედეგი არის AUC 0.74 და მოდელი, რომელსაც შეუძლია გაუარესების და სიკვდილიანობის პროგნოზირება.

სინთეტიკური მონაცემების გამოყენების შედეგად, ჩვენ შევძელით ამ ჯანდაცვის განბლოკვა ნაკლები რისკის, მეტი მონაცემებისა და მონაცემთა უფრო სწრაფი წვდომის პირობებში.

შეუთავსეთ მონაცემები მრავალი საავადმყოფოდან

ეს შესაძლებელია არა მხოლოდ საავადმყოფოს შიგნით, არამედ მრავალი საავადმყოფოს მონაცემების გაერთიანება. აქედან გამომდინარე, შემდეგი ნაბიჯი იყო მრავალი საავადმყოფოდან მონაცემების სინთეზირება. სხვადასხვა შესაბამისი საავადმყოფოს მონაცემები სინთეზირებული იყო მოდელისთვის SAS Viya-ში Syntho Engine-ის საშუალებით. აქ ჩვენ გავაცნობიერეთ AUC 0.78, რაც აჩვენებს, რომ მეტი მონაცემი იწვევს ამ მოდელების უკეთეს პროგნოზირებულ ძალას.

შედეგები

და ეს არის ამ ჰაკათონის შედეგები:

  • Syntho ინტეგრირებულია SAS Viya-ში, როგორც ნაბიჯი
  • სინთეტიკური მონაცემები წარმატებით გენერირდება Syntho-ს მეშვეობით SAS Viya-ში
  • სინთეტიკური მონაცემების სიზუსტე დამტკიცებულია, რადგან სინთეზურ მონაცემებზე გაწვრთნილი მოდელები ანალოგიურია, ვიდრე ორიგინალურ მონაცემებზე მომზადებული მოდელები
  • ჩვენ ვიწინასწარმეტყველეთ გაუარესება და სიკვდილიანობა სინთეზურ მონაცემებზე, როგორც კიბოს კვლევის ნაწილი
  • და აჩვენა AUC-ის ზრდა მრავალი საავადმყოფოდან სინთეზური მონაცემების გაერთიანებისას.

შემდეგი ნაბიჯები

შემდეგი ნაბიჯები არის

  • მოიცავს უფრო მეტ საავადმყოფოს
  • გამოყენების შემთხვევების გახანგრძლივება და
  • გავრცელდეს ნებისმიერ სხვა ორგანიზაციაზე, რადგან ტექნიკა სექტორის აგნოსტიკაა.

ასე ხსნიან Syntho და SAS მონაცემებს და აცნობიერებენ მონაცემებზე დაფუძნებულ შეხედულებებს ჯანდაცვის სფეროში, რათა დარწმუნდნენ, რომ ჯანდაცვა კარგად არის დაკომპლექტებული, ნორმალური წნევით სიცოცხლის გადასარჩენად.

Synthetic Data in Healthcare საფარი

შეინახეთ თქვენი სინთეზური მონაცემები ჯანდაცვის ანგარიშში!