Мы раскрываем увесь патэнцыял медыцынскіх даных з дапамогай генератыўнага штучнага інтэлекту падчас хакатона SAS.
Ахова здароўя вельмі мае патрэбу ў разуменні прывада дадзеных. Таму што ў ахове здароўя не хапае кадраў, у іх занадта вялікі ціск з магчымасцю выратаваць жыцці. Аднак медыцынскія даныя з'яўляюцца найбольш канфідэнцыяльнымі данымі і таму заблакіраваны. Гэтыя канфідэнцыяльныя даныя:
Гэта праблематычна, бо наша мэта гэтага хакатона - прагназаванне пагаршэння стану і смяротнасці ў рамках даследаванняў рака ў вядучай бальніцы. Вось чаму Syntho і SAS супрацоўнічаюць для гэтай бальніцы, дзе Syntho разблакуе даныя з дапамогай сінтэтычных даных, а SAS рэалізуе інфармацыю з дапамогай SAS Viya, вядучай аналітычнай платформы.
Наш Syntho Engine стварае цалкам новыя штучна згенераваныя даныя. Ключавая розніца ў тым, што мы ўжываем штучны інтэлект, каб імітаваць характарыстыкі даных рэальнага свету ў сінтэтычных даных, і да такой ступені, што іх можна нават выкарыстоўваць для аналітыкі. Вось чаму мы называем гэта сінтэтычным двайнікам дадзеных. Гэта так жа добра, як рэальныя і статыстычна ідэнтычныя зыходным даным, але без рызыкі прыватнасці.
Падчас гэтага хакатона мы інтэгравалі API Syntho Engine у SAS Viya як этап. Тут мы таксама пацвердзілі, што сінтэтычныя даныя ў SAS Viya сапраўды такія ж добрыя, як і рэальныя. Перш чым мы пачалі даследаванне рака, мы пратэставалі гэты інтэграваны падыход з адкрытым наборам даных і праверылі, ці сапраўды сінтэтычныя даныя такія ж добрыя, як і рэальныя, з дапамогай розных метадаў праверкі ў SAS Viya.
Захоўваюцца карэляцыі, адносіны паміж зменнымі.
Плошча пад крывой, мера прадукцыйнасці мадэлі, захоўваецца.
І нават важнасць зменнай, прагназуючая сіла зменных для мадэлі захоўваецца, калі мы параўноўваем зыходныя даныя з сінтэтычнымі.
Такім чынам, мы можам зрабіць выснову, што сінтэтычныя даныя, згенераваныя Syntho Engine у SAS Viya, сапраўды такія ж добрыя, як і рэальныя, і што мы можам выкарыстоўваць сінтэтычныя даныя для распрацоўкі мадэляў. Такім чынам, мы можам пачаць з гэтага даследавання рака, каб прадказаць пагаршэнне стану і смяротнасць.
Тут мы выкарысталі інтэграваны Syntho Engine як этап у SAS Viya, каб разблакіраваць гэтыя канфідэнцыяльныя даныя з дапамогай сінтэтычных даных.
У выніку AUC 0.74 і мадэль, якая здольная прадказаць пагаршэнне стану і смяротнасць.
У выніку выкарыстання сінтэтычных даных мы змаглі разблакіраваць гэтую сістэму аховы здароўя ў сітуацыі з меншай рызыкай, большай колькасцю даных і больш хуткім доступам да даных.
Гэта магчыма не толькі ў бальніцы, але і дадзеныя з некалькіх бальніц могуць быць аб'яднаны. Такім чынам, наступным крокам быў сінтэз дадзеных з некалькіх бальніц. Розныя адпаведныя бальнічныя даныя былі сінтэзаваны ў якасці ўваходных дадзеных для мадэлі ў SAS Viya праз Syntho Engine. Тут мы зразумелі, што AUC складае 0.78, дэманструючы, што большая колькасць даных прыводзіць да лепшай прагназуючай здольнасці гэтых мадэляў.
І вось вынікі гэтага хакатона:
Наступныя крокі - гэта
Вось як Syntho і SAS разблакуюць даныя і рэалізуюць інфармацыю, якая кіруецца дадзенымі, у ахове здароўя, каб пераканацца, што медыцынскія паслугі добра ўкамплектаваны персаналам і маюць звычайны ціск для выратавання жыццяў.