Գաղտնիությունից մինչև հնարավորություն. սինթետիկ տվյալների օգտագործումը ինտեգրված Syntho Engine-ի միջոցով SAS Viya-ում որպես SAS Hackathon-ի մաս՝ գաղտնիության նկատմամբ զգայուն տվյալները բացելու համար:

Մենք բացում ենք առողջապահական տվյալների ողջ ներուժը գեներատիվ AI-ի միջոցով SAS Hackathon-ի ժամանակ:

Ինչու՞ բացել գաղտնիության համար զգայուն առողջապահական տվյալները:

Առողջապահությունը խիստ կարիք ունի տվյալների շարժիչի պատկերացումների: Որովհետև առողջապահությունը թերի է, ճնշումների ենթարկված՝ կյանքեր փրկելու ներուժով: Այնուամենայնիվ, առողջապահական տվյալները գաղտնիության առավել զգայուն տվյալներն են և, հետևաբար, կողպված են: Այս գաղտնիության զգայուն տվյալները.

  • Մուտք գործելու համար ժամանակատար է
  • Պահանջում է լայնածավալ փաստաթղթեր
  • Եվ պարզապես չի կարող օգտագործվել

Սա խնդրահարույց է, քանի որ այս հաքաթոնի մեր նպատակն է կանխատեսել վատթարացումն ու մահացությունը՝ որպես առաջատար հիվանդանոցի քաղցկեղի հետազոտության մաս: Ահա թե ինչու Syntho-ն և SAS-ը համագործակցում են այս հիվանդանոցի համար, որտեղ Syntho-ն բացում է տվյալները սինթետիկ տվյալների միջոցով, իսկ SAS-ն իրականացնում է տվյալների պատկերացումներ SAS Viya-ի՝ վերլուծական առաջատար հարթակի հետ:

Սինթետիկ տվյալներ.

Մեր Syntho Engine-ը ստեղծում է բոլորովին նոր արհեստականորեն ստեղծված տվյալներ: Հիմնական տարբերությունը, մենք կիրառում ենք AI-ն՝ ընդօրինակելու իրական աշխարհի տվյալների բնութագրերը սինթետիկ տվյալների մեջ և այնքանով, որ այն կարող է օգտագործվել նույնիսկ վերլուծության համար: Ահա թե ինչու մենք այն անվանում ենք սինթետիկ տվյալների երկվորյակ: Այն նույնքան իրական է և վիճակագրորեն նույնական է սկզբնական տվյալներին, բայց առանց գաղտնիության ռիսկերի:

Syntho Engine ինտեգրված SAS Viya-ում

Այս հաքաթոնի ընթացքում մենք որպես քայլ ինտեգրեցինք Syntho Engine API-ն SAS Viya-ում: Այստեղ մենք նաև հաստատեցինք, որ սինթետիկ տվյալները իսկապես այնքան լավն են, որքան իրական են SAS Viya-ում: Նախքան քաղցկեղի հետազոտությունը սկսելը, մենք փորձարկեցինք այս ինտեգրված մոտեցումը բաց տվյալների բազայի միջոցով և հաստատեցինք, թե արդյոք սինթետիկ տվյալները իսկապես նույնքան իրական են SAS Viya-ում վավերացման տարբեր մեթոդների միջոցով:

Արդյո՞ք սինթետիկ տվյալները նույնքան իրական են:

Հարաբերությունները, փոփոխականների հարաբերությունները պահպանվում են։

Պահպանվել է կորի տակ գտնվող տարածքը՝ մոդելի կատարողականի չափանիշ:

Եվ նույնիսկ փոփոխական նշանակությունը, մոդելի համար փոփոխականների կանխատեսող ուժը, պահպանվում է, երբ մենք սկզբնական տվյալները համեմատում ենք սինթետիկ տվյալների հետ:

Հետևաբար, մենք կարող ենք եզրակացնել, որ SAS Viya-ում Syntho Engine-ի կողմից ստեղծված սինթետիկ տվյալները իսկապես լավն են, ինչպես իրական, և որ մենք կարող ենք օգտագործել սինթետիկ տվյալներ մոդելի մշակման համար: Հետևաբար, մենք կարող ենք սկսել քաղցկեղի այս հետազոտությունից՝ կանխատեսելու վատթարացումը և մահացությունը:

Սինթետիկ տվյալներ առաջատար հիվանդանոցի քաղցկեղի հետազոտության համար

Այստեղ մենք օգտագործեցինք ինտեգրված Syntho Engine-ը որպես SAS Viya-ի քայլ՝ այս գաղտնիության զգայուն տվյալները սինթետիկ տվյալների միջոցով բացելու համար:

Արդյունքը՝ AUC 0.74 և մոդել, որն ի վիճակի է կանխատեսել վատթարացումն ու մահացությունը:

Սինթետիկ տվյալների օգտագործման արդյունքում մենք կարողացանք բացել այս առողջապահությունը մի իրավիճակում, որտեղ ավելի քիչ ռիսկեր կան, ավելի շատ տվյալներ և տվյալների ավելի արագ հասանելիություն:

Միավորել բազմաթիվ հիվանդանոցների տվյալները

Դա հնարավոր է ոչ միայն հիվանդանոցի ներսում, այլև կարելի է համատեղել բազմաթիվ հիվանդանոցների տվյալները: Հետևաբար, հաջորդ քայլը բազմաթիվ հիվանդանոցներից տվյալների սինթեզումն էր: Տարբեր համապատասխան հիվանդանոցային տվյալներ սինթեզվել են որպես մոդելի մուտքագրում SAS Viya-ում Syntho Engine-ի միջոցով: Այստեղ մենք հասկացանք 0.78 AUC-ն՝ ցույց տալով, որ ավելի շատ տվյալներ հանգեցնում են այդ մոդելների ավելի լավ կանխատեսող հզորությանը:

Արդյունքներ

Եվ ահա այս հաքաթոնի արդյունքները.

  • Syntho-ն ինտեգրված է SAS Viya-ում որպես քայլ
  • սինթետիկ տվյալները հաջողությամբ ստեղծվում են Syntho-ի միջոցով SAS Viya-ում
  • Սինթետիկ տվյալների ճշգրտությունը հաստատված է, քանի որ սինթետիկ տվյալների վրա ուսուցանված մոդելները գնահատվում են նույնքան, քան սկզբնական տվյալների վրա պատրաստված մոդելները
  • մենք կանխատեսել ենք սինթետիկ տվյալների վատթարացում և մահացություն՝ որպես քաղցկեղի հետազոտության մաս
  • և ցույց են տվել AUC-ի աճ՝ մի քանի հիվանդանոցներից ստացված սինթետիկ տվյալները համադրելիս:

Հաջորդ քայլերը

Հաջորդ քայլերն են

  • ներառում է ավելի շատ հիվանդանոցներ
  • երկարացնել օգտագործման դեպքերը և
  • տարածել ցանկացած այլ կազմակերպության վրա, քանի որ տեխնիկան ոլորտային ագնոստիկ է:

Ահա թե ինչպես են Syntho-ն և SAS-ը բացում են տվյալները և գիտակցում են տվյալների վրա հիմնված պատկերացումները առողջապահության ոլորտում՝ համոզվելու համար, որ առողջապահությունը լավ կադրային է, նորմալ ճնշումով՝ կյանքեր փրկելու համար:

Առողջապահության ոլորտում սինթետիկ տվյալներ ծածկույթ

Պահպանեք ձեր սինթետիկ տվյալները առողջապահական զեկույցում: