Gizlilikten Olasılığa: Gizliliğe duyarlı verilerin kilidini açmak için SAS Hackathon'un bir parçası olarak SAS Viya'daki entegre Syntho Engine aracılığıyla Sentetik Verileri kullanma

SAS Hackathon'u sırasında üretici yapay zeka ile sağlık hizmeti verilerinin tüm potansiyelini ortaya çıkarıyoruz.

Gizliliğe duyarlı sağlık hizmeti verilerinin kilidini neden açmalısınız?

Sağlık sektörünün ciddi şekilde veri güdümlü içgörülere ihtiyacı var. Çünkü sağlık hizmetleri yetersiz ve hayat kurtarma potansiyeline sahip aşırı baskı altında. Bununla birlikte, sağlık hizmeti verileri mahremiyet açısından en hassas verilerdir ve bu nedenle kilitlidir. Bu gizliliğe duyarlı veriler:

  • Erişmek zaman alıyor
  • Kapsamlı evrak gerektirir
  • Ve basitçe kullanılamaz

Bu hackathon'daki amacımız önde gelen bir hastane için kanser araştırmasının bir parçası olarak bozulma ve ölüm oranını tahmin etmek olduğundan, bu sorunludur. Bu nedenle Syntho ve SAS, Syntho'nun sentetik verilerle verilerin kilidini açtığı ve SAS'ın önde gelen analitik platformu SAS Viya ile veri içgörülerini gerçekleştirdiği bu hastane için işbirliği yapıyor.

Sentetik veri mi?

Syntho Motorumuz tamamen yeni, yapay olarak üretilmiş veriler üretir. Temel fark, sentetik verilerde gerçek dünya verilerinin özelliklerini taklit etmek için ve analitik için bile kullanılabilecek ölçüde yapay zeka uyguluyoruz. Bu yüzden ona sentetik veri ikizi diyoruz. Gerçek kadar iyidir ve orijinal verilerle istatistiksel olarak aynıdır, ancak gizlilik riskleri yoktur.

SAS Viya'ya entegre Syntho Engine

Bu hackathon sırasında Syntho Engine API'yi adım olarak SAS Viya'ya entegre ettik. Burada ayrıca sentetik verilerin SAS Viya'da gerçekten de gerçek kadar iyi olduğunu doğruladık. Kanser araştırmasına başlamadan önce, bu entegre yaklaşımı açık bir veri kümesiyle test ettik ve sentetik verilerin gerçekten de gerçek kadar iyi olup olmadığını SAS Viya'daki çeşitli doğrulama yöntemleriyle doğruladık.

Sentetik veriler gerçek kadar iyi mi?

Korelasyonlar, değişkenler arasındaki ilişkiler korunur.

Model performansı için bir ölçü olan Eğrinin Altındaki Alan korunur.

Ve bir model için değişkenlerin tahmin gücü olan değişken önemi bile, orijinal verileri sentetik verilerle karşılaştırdığımızda geçerlidir.

Dolayısıyla, SAS Viya'da Syntho Engine tarafından üretilen sentetik verilerin gerçekten de gerçek kadar iyi olduğu ve sentetik verileri model geliştirme için kullanabileceğimiz sonucuna varabiliriz. Bu nedenle, bozulma ve ölüm oranını tahmin etmek için bu kanser araştırması ile başlayabiliriz.

Önde gelen bir hastane için Kanser Araştırması için sentetik veriler

Burada, gizliliğe duyarlı bu verilerin sentetik verilerle kilidini açmak için SAS Viya'da adım olarak entegre Syntho Engine'i kullandık.

Sonuç, 0.74'lük bir AUC ve kötüleşme ile ölüm oranını tahmin edebilen bir model.

Sentetik verileri kullanmanın bir sonucu olarak, daha az risk, daha fazla veri ve daha hızlı veri erişimi olan bir durumda bu sağlık hizmetinin kilidini açmayı başardık.

Birden çok hastaneden alınan verileri birleştirin

Bu sadece hastane içinde mümkün değil, aynı zamanda birden fazla hastaneden alınan veriler birleştirilebilir. Bu nedenle, bir sonraki adım, birden çok hastaneden gelen verileri sentezlemekti. Farklı ilgili hastane verileri, Syntho Engine aracılığıyla SAS Viya'daki model için girdi olarak sentezlendi. Burada, daha fazla verinin bu modellerin daha iyi tahmin gücüne yol açtığını gösteren 0.78'lik bir AUC gerçekleştirdik.

Sonuçlar

Ve bunlar da bu hackathon'un sonuçları:

  • Syntho, adım olarak SAS Viya'ya entegre edilmiştir
  • sentetik veriler, SAS Viya'da Syntho aracılığıyla başarıyla üretilir
  • Sentetik veriler üzerinde eğitilen Modeller, orijinal veriler üzerinde eğitilen modellere benzer puan aldığından, sentetik veri doğruluğu onaylanmıştır.
  • kanser araştırmasının bir parçası olarak sentetik verilerde bozulma ve ölüm oranını tahmin ettik
  • ve birden fazla hastaneden sentetik verileri birleştirirken EAA'da artış gösterdi.

Sonraki adımlar

Sonraki adımlar

  • daha fazla hastane dahil
  • kullanım durumlarını genişletmek ve
  • teknikler sektörden bağımsız olduğundan, başka herhangi bir kuruluşa yayılmak için.

Bu, Syntho ve SAS'ın sağlık hizmetlerinde iyi bir kadroya sahip olduğundan ve hayat kurtarmak için normal bir baskı altında olduğundan emin olmak için verileri açığa çıkarma ve veriye dayalı içgörüleri gerçekleştirme şeklidir.

Sağlık Hizmetlerinde Sentetik Veriler kapsamı

Sentetik verilerinizi sağlık raporuna kaydedin!