Daripada Privasi kepada Kemungkinan: Menggunakan Data Sintetik melalui Enjin Syntho bersepadu dalam SAS Viya sebagai sebahagian daripada Hackathon SAS untuk membuka kunci data sensitif privasi

Kami membuka kunci potensi penuh data penjagaan kesihatan dengan AI generatif semasa Hackathon SAS.

Mengapa membuka kunci data penjagaan kesihatan sensitif privasi?

Penjagaan kesihatan amat memerlukan cerapan pemacu data. Kerana penjagaan kesihatan kekurangan kakitangan, terlalu tertekan dengan potensi untuk menyelamatkan nyawa. Walau bagaimanapun, data penjagaan kesihatan adalah data paling sensitif privasi dan oleh itu dikunci. Data sensitif privasi ini:

  • Memakan masa untuk mengakses
  • Memerlukan kertas kerja yang luas
  • Dan tidak boleh digunakan begitu sahaja

Ini bermasalah, kerana matlamat kami untuk hackathon ini meramalkan kemerosotan dan kematian sebagai sebahagian daripada penyelidikan kanser untuk hospital terkemuka. Itulah sebabnya Syntho dan SAS bekerjasama untuk hospital ini, di mana Syntho membuka kunci data dengan data sintetik dan SAS merealisasikan cerapan data dengan SAS Viya, platform analitik terkemuka.

Data sintetik?

Enjin Syntho kami menjana data buatan buatan yang baharu sepenuhnya. Perbezaan utama, kami menggunakan AI untuk meniru ciri-ciri data dunia sebenar dalam data sintetik, dan sehingga ke tahap yang boleh digunakan untuk analisis. Itulah sebabnya kami memanggilnya kembar data sintetik. Ia adalah sama baik seperti sebenar dan sama secara statistik dengan data asal, tetapi tanpa risiko privasi.

Enjin Syntho disepadukan dalam SAS Viya

Semasa hackathon ini, kami menyepadukan Syntho Engine API dalam SAS Viya sebagai langkah. Di sini kami juga mengesahkan bahawa data sintetik sememangnya sama baik seperti yang sebenar dalam SAS Viya. Sebelum kami memulakan penyelidikan kanser, kami telah menguji pendekatan bersepadu ini dengan set data terbuka dan mengesahkan jika data sintetik sememangnya baik-sebenar melalui pelbagai kaedah pengesahan dalam SAS Viya.

Adakah data sintetik sebagai-baik-sebenar?

Korelasi, hubungan antara pembolehubah, dipelihara.

Kawasan Di Bawah lengkung, ukuran untuk prestasi model, dikekalkan.

Malah kepentingan pembolehubah, kuasa ramalan pembolehubah untuk model, berlaku apabila kita membandingkan data asal dengan data sintetik.

Oleh itu, kita boleh membuat kesimpulan bahawa data sintetik yang dijana oleh Enjin Syntho dalam SAS Viya sememangnya baik-sebenar dan kita boleh menggunakan data sintetik untuk pembangunan model. Oleh itu, kita boleh mulakan dengan penyelidikan kanser ini untuk meramalkan kemerosotan dan kematian.

Data sintetik untuk Penyelidikan Kanser untuk hospital terkemuka

Di sini, kami menggunakan Enjin Syntho bersepadu sebagai langkah dalam SAS Viya untuk membuka kunci data sensitif privasi ini dengan data sintetik.

Hasilnya, AUC sebanyak 0.74 dan model yang mampu meramalkan kemerosotan dan kematian.

Hasil daripada menggunakan data sintetik, kami dapat membuka kunci penjagaan kesihatan ini dalam situasi yang kurang risiko, lebih banyak data dan akses data yang lebih pantas.

Menggabungkan data daripada pelbagai hospital

Ini bukan sahaja boleh dilakukan di dalam hospital, juga data dari pelbagai hospital boleh digabungkan. Oleh itu, langkah seterusnya ialah mensintesis data daripada pelbagai hospital. Data hospital berkaitan yang berbeza telah disintesis sebagai input untuk model dalam SAS Viya melalui Enjin Syntho. Di sini, kami menyedari AUC sebanyak 0.78, menunjukkan bahawa lebih banyak data menghasilkan kuasa ramalan yang lebih baik bagi model tersebut.

Hasil

Dan ini adalah hasil daripada hackathon ini:

  • Syntho disepadukan dalam SAS Viya sebagai langkah
  • data sintetik berjaya dijana melalui Syntho dalam SAS Viya
  • Ketepatan data sintetik diluluskan, kerana Model yang dilatih pada skor data sintetik serupa dengan model yang dilatih pada data asal
  • kami meramalkan kemerosotan dan kematian pada data sintetik sebagai sebahagian daripada penyelidikan kanser
  • dan menunjukkan peningkatan dalam AUC apabila menggabungkan data sintetik daripada pelbagai hospital.

Langkah seterusnya

Langkah seterusnya ialah

  • termasuk lebih banyak hospital
  • untuk melanjutkan kes penggunaan dan
  • untuk meluaskan kepada mana-mana organisasi lain, kerana tekniknya adalah agnostik sektor.

Beginilah cara Syntho dan SAS membuka kunci data dan merealisasikan cerapan terdorong data dalam penjagaan kesihatan untuk memastikan penjagaan kesihatan mempunyai kakitangan yang baik, dengan tekanan biasa untuk menyelamatkan nyawa.

Data Sintetik dalam perlindungan Kesihatan

Simpan data sintetik anda dalam laporan penjagaan kesihatan!