ჩვენ ვხსნით ჯანდაცვის მონაცემების სრულ პოტენციალს გენერაციული AI-ით SAS Hackathon-ის დროს.
ჯანდაცვას სერიოზულად სჭირდება მონაცემთა დისკზე ინფორმაციის მიწოდება. იმის გამო, რომ ჯანდაცვა არასაკმარისია, მეტი ზეწოლა აქვს სიცოცხლის გადარჩენის პოტენციალს. თუმცა, ჯანდაცვის მონაცემები არის ყველაზე მგრძნობიარე მონაცემები კონფიდენციალურობისთვის და, შესაბამისად, დაბლოკილია. ეს კონფიდენციალურობის მგრძნობიარე მონაცემები:
ეს პრობლემატურია, რადგან ჩვენი მიზანი ამ ჰაკათონის გაუარესებისა და სიკვდილიანობის პროგნოზირებაა, როგორც კიბოს კვლევის ნაწილი წამყვანი საავადმყოფოსთვის. სწორედ ამიტომ Syntho და SAS თანამშრომლობენ ამ საავადმყოფოსთვის, სადაც Syntho ხსნის მონაცემებს სინთეზური მონაცემებით და SAS ახორციელებს მონაცემთა ანალიზს SAS Viya-სთან, ანალიტიკური წამყვანი პლატფორმით.
ჩვენი Syntho Engine წარმოქმნის სრულიად ახალ ხელოვნურად გენერირებულ მონაცემებს. ძირითადი განსხვავება, ჩვენ ვიყენებთ AI-ს, რათა მივბაძოთ რეალურ სამყაროში არსებული მონაცემების მახასიათებლებს სინთეზურ მონაცემებში და იმდენად, რომ ის შეიძლება გამოყენებულ იქნას ანალიტიკისთვისაც კი. ამიტომ მას ვუწოდებთ სინთეზურ მონაცემთა ტყუპს. ის ისეთივე კარგია, როგორც რეალური და სტატისტიკურად იდენტურია თავდაპირველ მონაცემებთან, მაგრამ კონფიდენციალურობის რისკების გარეშე.
ამ ჰაკათონის დროს ჩვენ გავაერთიანეთ Syntho Engine API SAS Viya-ში, როგორც ნაბიჯი. აქ ჩვენ ასევე დავადასტურეთ, რომ სინთეზური მონაცემები მართლაც ისეთივე კარგია, როგორც რეალური SAS Viya-ში. სანამ კიბოს კვლევას დავიწყებდით, ჩვენ გამოვცადეთ ეს ინტეგრირებული მიდგომა ღია მონაცემთა ნაკრებით და დავადასტურეთ, არის თუ არა სინთეზური მონაცემები მართლაც ისეთივე კარგი, როგორც რეალური SAS Viya-ში ვალიდაციის სხვადასხვა მეთოდით.
შენარჩუნებულია კორელაციები, ურთიერთობები ცვლადებს შორის.
მრუდის ქვეშ არსებული ფართობი, მოდელის მუშაობის საზომი, შენარჩუნებულია.
და ცვლადის მნიშვნელობაც კი, მოდელისთვის ცვლადების პროგნოზირებადი ძალაა, როდესაც ჩვენ შევადარებთ ორიგინალურ მონაცემებს სინთეტიკურ მონაცემებს.
აქედან გამომდინარე, შეგვიძლია დავასკვნათ, რომ SAS Viya-ში Syntho Engine-ის მიერ გენერირებული სინთეზური მონაცემები მართლაც ისეთივე კარგია, როგორც რეალური და რომ ჩვენ შეგვიძლია გამოვიყენოთ სინთეზური მონაცემები მოდელის განვითარებისთვის. აქედან გამომდინარე, ჩვენ შეგვიძლია დავიწყოთ კიბოს ამ გამოკვლევით გაუარესების და სიკვდილიანობის პროგნოზირება.
აქ, ჩვენ გამოვიყენეთ ინტეგრირებული Syntho Engine, როგორც ნაბიჯი SAS Viya-ში, რათა განვბლოკოთ ეს კონფიდენციალურობის მგრძნობიარე მონაცემები სინთეტიკური მონაცემებით.
შედეგი არის AUC 0.74 და მოდელი, რომელსაც შეუძლია გაუარესების და სიკვდილიანობის პროგნოზირება.
სინთეტიკური მონაცემების გამოყენების შედეგად, ჩვენ შევძელით ამ ჯანდაცვის განბლოკვა ნაკლები რისკის, მეტი მონაცემებისა და მონაცემთა უფრო სწრაფი წვდომის პირობებში.
ეს შესაძლებელია არა მხოლოდ საავადმყოფოს შიგნით, არამედ მრავალი საავადმყოფოს მონაცემების გაერთიანება. აქედან გამომდინარე, შემდეგი ნაბიჯი იყო მრავალი საავადმყოფოდან მონაცემების სინთეზირება. სხვადასხვა შესაბამისი საავადმყოფოს მონაცემები სინთეზირებული იყო მოდელისთვის SAS Viya-ში Syntho Engine-ის საშუალებით. აქ ჩვენ გავაცნობიერეთ AUC 0.78, რაც აჩვენებს, რომ მეტი მონაცემი იწვევს ამ მოდელების უკეთეს პროგნოზირებულ ძალას.
და ეს არის ამ ჰაკათონის შედეგები:
შემდეგი ნაბიჯები არის
ასე ხსნიან Syntho და SAS მონაცემებს და აცნობიერებენ მონაცემებზე დაფუძნებულ შეხედულებებს ჯანდაცვის სფეროში, რათა დარწმუნდნენ, რომ ჯანდაცვა კარგად არის დაკომპლექტებული, ნორმალური წნევით სიცოცხლის გადასარჩენად.