Ад канфідэнцыяльнасці да магчымасці: выкарыстанне сінтэтычных даных праз убудаваны механізм Syntho Engine у ​​SAS Viya як частка хакатона SAS для разблакіроўкі канфідэнцыяльных даных

Мы раскрываем увесь патэнцыял медыцынскіх даных з дапамогай генератыўнага штучнага інтэлекту падчас хакатона SAS.

Навошта разблакіраваць сакрэтныя даныя аховы здароўя?

Ахова здароўя вельмі мае патрэбу ў разуменні прывада дадзеных. Таму што ў ахове здароўя не хапае кадраў, у іх занадта вялікі ціск з магчымасцю выратаваць жыцці. Аднак медыцынскія даныя з'яўляюцца найбольш канфідэнцыяльнымі данымі і таму заблакіраваны. Гэтыя канфідэнцыяльныя даныя:

  • Доступ займае шмат часу
  • Патрабуе вялікай папяровай цяганіны
  • І нельга проста выкарыстоўваць

Гэта праблематычна, бо наша мэта гэтага хакатона - прагназаванне пагаршэння стану і смяротнасці ў рамках даследаванняў рака ў вядучай бальніцы. Вось чаму Syntho і SAS супрацоўнічаюць для гэтай бальніцы, дзе Syntho разблакуе даныя з дапамогай сінтэтычных даных, а SAS рэалізуе інфармацыю з дапамогай SAS Viya, вядучай аналітычнай платформы.

Сінтэтычныя дадзеныя?

Наш Syntho Engine стварае цалкам новыя штучна згенераваныя даныя. Ключавая розніца ў тым, што мы ўжываем штучны інтэлект, каб імітаваць характарыстыкі даных рэальнага свету ў сінтэтычных даных, і да такой ступені, што іх можна нават выкарыстоўваць для аналітыкі. Вось чаму мы называем гэта сінтэтычным двайнікам дадзеных. Гэта так жа добра, як рэальныя і статыстычна ідэнтычныя зыходным даным, але без рызыкі прыватнасці.

Syntho Engine інтэграваны ў SAS Viya

Падчас гэтага хакатона мы інтэгравалі API Syntho Engine у ​​SAS Viya як этап. Тут мы таксама пацвердзілі, што сінтэтычныя даныя ў SAS Viya сапраўды такія ж добрыя, як і рэальныя. Перш чым мы пачалі даследаванне рака, мы пратэставалі гэты інтэграваны падыход з адкрытым наборам даных і праверылі, ці сапраўды сінтэтычныя даныя такія ж добрыя, як і рэальныя, з дапамогай розных метадаў праверкі ў SAS Viya.

Ці сапраўды сінтэтычныя даныя такія ж добрыя?

Захоўваюцца карэляцыі, адносіны паміж зменнымі.

Плошча пад крывой, мера прадукцыйнасці мадэлі, захоўваецца.

І нават важнасць зменнай, прагназуючая сіла зменных для мадэлі захоўваецца, калі мы параўноўваем зыходныя даныя з сінтэтычнымі.

Такім чынам, мы можам зрабіць выснову, што сінтэтычныя даныя, згенераваныя Syntho Engine у ​​SAS Viya, сапраўды такія ж добрыя, як і рэальныя, і што мы можам выкарыстоўваць сінтэтычныя даныя для распрацоўкі мадэляў. Такім чынам, мы можам пачаць з гэтага даследавання рака, каб прадказаць пагаршэнне стану і смяротнасць.

Сінтэтычныя даныя для даследаванняў рака для вядучай бальніцы

Тут мы выкарысталі інтэграваны Syntho Engine як этап у SAS Viya, каб разблакіраваць гэтыя канфідэнцыяльныя даныя з дапамогай сінтэтычных даных.

У выніку AUC 0.74 і мадэль, якая здольная прадказаць пагаршэнне стану і смяротнасць.

У выніку выкарыстання сінтэтычных даных мы змаглі разблакіраваць гэтую сістэму аховы здароўя ў сітуацыі з меншай рызыкай, большай колькасцю даных і больш хуткім доступам да даных.

Аб'яднайце даныя з некалькіх бальніц

Гэта магчыма не толькі ў бальніцы, але і дадзеныя з некалькіх бальніц могуць быць аб'яднаны. Такім чынам, наступным крокам быў сінтэз дадзеных з некалькіх бальніц. Розныя адпаведныя бальнічныя даныя былі сінтэзаваны ў якасці ўваходных дадзеных для мадэлі ў SAS Viya праз Syntho Engine. Тут мы зразумелі, што AUC складае 0.78, дэманструючы, што большая колькасць даных прыводзіць да лепшай прагназуючай здольнасці гэтых мадэляў.

Вынікі

І вось вынікі гэтага хакатона:

  • Syntho інтэграваны ў SAS Viya як крок
  • сінтэтычныя даныя паспяхова генеруюцца праз Syntho ў SAS Viya
  • Дакладнасць сінтэтычных даных зацверджана, бо мадэлі, навучаныя на сінтэтычных даных, маюць такія ж балы, як і мадэлі, навучаныя на зыходных дадзеных
  • мы прадказалі пагаршэнне і смяротнасць на сінтэтычных дадзеных у рамках даследаванняў рака
  • і прадэманстраваў павелічэнне AUC пры аб'яднанні сінтэтычных дадзеных з некалькіх бальніц.

Наступныя крокі

Наступныя крокі - гэта

  • уключыць больш бальніц
  • каб пашырыць варыянты выкарыстання і
  • распаўсюдзіць на любую іншую арганізацыю, паколькі метады не залежаць ад сектара.

Вось як Syntho і SAS разблакуюць даныя і рэалізуюць інфармацыю, якая кіруецца дадзенымі, у ахове здароўя, каб пераканацца, што медыцынскія паслугі добра ўкамплектаваны персаналам і маюць звычайны ціск для выратавання жыццяў.

Вокладка "Сінтэтычныя даныя ў ахове здароўя".

Захавайце свае сінтэтычныя дадзеныя ў справаздачы аб ахове здароўя!