Від конфіденційності до можливостей: використання синтетичних даних через інтегрований механізм Syntho в SAS Viya як частину SAS Hackathon для розблокування конфіденційних даних

Ми розкриваємо весь потенціал медичних даних за допомогою генеративного штучного інтелекту під час хакатону SAS.

Навіщо розблоковувати конфіденційні медичні дані?

Охорона здоров’я вкрай потребує аналізу даних. Тому що медична допомога не укомплектована персоналом, перевантажена, і є потенціал для порятунку життів. Однак медичні дані є найбільш конфіденційними даними, тому вони заблоковані. Ці конфіденційні дані:

  • Доступ вимагає багато часу
  • Вимагає великої документації
  • І не можна просто використовувати

Це проблематично, оскільки нашою метою цього хакатону є прогнозування погіршення стану та смертності в рамках дослідження раку для провідної лікарні. Ось чому Syntho та SAS співпрацюють для цієї лікарні, де Syntho розблоковує дані за допомогою синтетичних даних, а SAS реалізує аналіз даних за допомогою SAS Viya, провідної аналітичної платформи.

Синтетичні дані?

Наш Syntho Engine генерує абсолютно нові штучно створені дані. Ключова відмінність полягає в тому, що ми застосовуємо штучний інтелект для імітації характеристик даних реального світу в синтетичних даних і до такої міри, що його можна використовувати навіть для аналітики. Ось чому ми називаємо це двійником синтетичних даних. Це так само добре, як реальні та статистично ідентичні вихідним даним, але без ризиків для конфіденційності.

Syntho Engine інтегрований у SAS Viya

Під час цього хакатону ми інтегрували API Syntho Engine у ​​SAS Viya як крок. Тут ми також підтвердили, що синтетичні дані справді такі ж хороші, як і реальні в SAS Viya. Перш ніж почати дослідження раку, ми перевірили цей інтегрований підхід із відкритим набором даних і перевірили, чи справді синтетичні дані настільки ж хороші, як реальні, за допомогою різних методів перевірки в SAS Viya.

Чи синтетичні дані настільки ж хороші, як реальні?

Зберігаються кореляції, зв'язки між змінними.

Площа під кривою, показник продуктивності моделі, зберігається.

І навіть важливість змінної, прогностична сила змінних для моделі зберігається, коли ми порівнюємо вихідні дані з синтетичними даними.

Отже, ми можемо зробити висновок, що синтетичні дані, згенеровані Syntho Engine у ​​SAS Viya, справді такі ж хороші, як реальні, і що ми можемо використовувати синтетичні дані для розробки моделі. Отже, ми можемо почати з цього дослідження раку, щоб передбачити погіршення стану та смертність.

Синтетичні дані для дослідження раку для провідної лікарні

Тут ми використали інтегрований Syntho Engine як крок у SAS Viya, щоб розблокувати конфіденційні дані за допомогою синтетичних даних.

Результат: AUC 0.74 і модель, яка здатна передбачити погіршення стану та смертність.

В результаті використання синтетичних даних ми змогли розблокувати цю медичну допомогу в ситуації з меншим ризиком, більшою кількістю даних і швидшим доступом до них.

Об’єднайте дані з кількох лікарень

Це можливо не лише в межах лікарні, але також можна об’єднувати дані з кількох лікарень. Таким чином, наступним кроком був синтез даних з кількох лікарень. Різні відповідні лікарняні дані були синтезовані як вхідні дані для моделі в SAS Viya за допомогою Syntho Engine. Тут ми зрозуміли, що AUC становить 0.78, демонструючи, що більше даних призводить до кращої передбачуваної сили цих моделей.

результати

А ось результати цього хакатону:

  • Syntho інтегровано в SAS Viya як крок
  • синтетичні дані успішно згенеровані через Syntho в SAS Viya
  • Точність синтетичних даних схвалено, оскільки моделі, навчені на синтетичних даних, мають такі ж результати, як моделі, навчені на оригінальних даних
  • ми передбачили погіршення стану та смертність на основі синтетичних даних у рамках дослідження раку
  • і продемонстрували збільшення AUC при поєднанні синтетичних даних з кількох лікарень.

Наступні кроки

Наступними кроками є

  • включити більше лікарень
  • розширити випадки використання та
  • поширити на будь-яку іншу організацію, оскільки методи не залежать від сектора.

Ось як Syntho та SAS розблоковують дані та реалізують на основі даних розуміння в охороні здоров’я, щоб переконатися, що в охороні здоров’я добре укомплектовано кадри, з нормальним тиском для порятунку життів.

Обкладинка «Синтетичні дані в охороні здоров’я».

Збережіть свої синтетичні дані у звіті про охорону здоров'я!