Маълумоти беном ва маълумоти синтетикӣ

Агар шумо пеш аз гузаронидани санҷиши додаҳои таҳлили додаҳо маълумоти худро беном гардонед, якчанд омилҳо мавҷуданд:

  1. Тақрибан дар ҳама ҳолатҳо, маълумоти беномро метавон аз рӯи сатрҳои мушаххас ва беназир (масалан, сабтҳои тиббӣ) ба шахсони алоҳида пайгирӣ кард.
  2. Чӣ қадаре ки шумо беном ё умумӣ кунед, ҳамон қадар маълумотро нобуд мекунед. Ин сифати маълумоти шуморо паст мекунад ва ҳамин тавр фаҳмиши шуморо паст мекунад
  3. Анонимизатсия барои форматҳои гуногуни додаҳо ба таври гуногун кор мекунад. Ин маънои онро дорад, ки он миқёспазир нест ва метавонад вақти зиёдро талаб кунад

Маълумоти синтетикӣ ҳамаи ин камбудиҳо ва ғайраро бартараф мекунад. Видеои зерро тамошо кунед, то бубинед, ки коршиноси таҳлилӣ аз SAS (пешвои бозори ҷаҳонии аналитика) дар бораи арзёбии худ дар бораи фарқияти сифат байни маълумоти аслӣ, маълумоти беном ва аз ҷониби Syntho додаҳои синтетикӣ тавлидшуда шарҳ диҳад.

Ин видео аз Syntho x SAS D[N]A Café дар бораи маълумотҳои синтетикии тавлидшудаи AI гирифта шудааст. Видеои пурраро дар ин ҷо пайдо кунед.

Эдвин ван Унен ба Syntho маҷмӯи додаҳои аслӣ фиристод ва мо маҷмӯи маълумотро синтез кардем. Аммо савол инчунин буд: "Агар мо маълумоти синтетикиро бо маълумоти беном муқоиса кунем, чӣ мешавад?" Азбаски шумо маълумоти зиёдеро дар маълумоти беном гум мекунед, оё ин ҳангоми синтези маҷмӯи додаҳо низ рӯй медиҳад? Мо бо маҷмӯаи маълумот аз соҳаи телекоммуникатсия бо 56.000 сатр ва 128 сутуни иттилооти пошхӯрии ширкат оғоз кардем. Ин маҷмӯаи маълумот ҳам синтез ва ҳам беном карда шуд, то Эдвин тавонад синтезро бо анонимизатсия муқоиса кунад. Сипас, Эдвин бо истифода аз SAS Viya моделсозӣ оғоз кард. Вай дар маҷмӯаи додаҳои аслӣ бо истифода аз усулҳои регрессионии классикӣ ва дарахтони қарорҳо, инчунин усулҳои мураккабтаре ба монанди шабакаҳои нейрон, афзоиши градиент, ҷангали тасодуфӣ - ин гуна усулҳо якчанд моделҳои пошхӯрӣ сохтааст. Истифодаи вариантҳои стандартии SAS Viya ҳангоми сохтани моделҳо.

Сипас, вақти он расидааст, ки ба натиҷаҳо назар андозем. Натиҷаҳо барои маълумоти синтетикӣ хеле умедбахш буданд, на барои беномсозӣ. Барои коршиносони омӯзиши ягон мошин дар аудитория, мо ба майдони зери хатти ROC-каҷӣ назар мекунем, ки дар бораи дақиқии модел чизе нақл мекунад. Муқоиса маълумоти аслӣ ба маълумоти беном, мо мебинем, ки модели маълумоти аслӣ дорои майдони зери ROC-каҷи аз .8, ки хеле хуб аст, Аммо, маълумоти беном дорад, майдони зери каљ ROC аз .6. Ин маънои онро дорад, ки мо бо модели номаълум маълумоти зиёдеро аз даст медиҳем, то шумо қудрати зиёди пешгӯиро аз даст медиҳед.

Аммо пас, савол ин аст, ки дар бораи маълумоти синтетикӣ чӣ гуфтан мумкин аст? Дар ин ҷо, мо айнан ҳамин тавр кардем, аммо ба ҷои беном кардани маълумот, Syntho маълумотро синтез кард. Ҳоло, мо мебинем, ки ҳам маълумоти аслӣ ва ҳам маълумоти синтетикӣ майдони зери каҷи ROC-и .8 доранд, ки хеле монанд аст. Аз сабаби тағирёбӣ комилан якхела нест, аммо хеле монанд. Ин маънои онро дорад, ки потенсиали маълумоти синтетикӣ хеле умедбахш аст - Эдвин аз ин хеле шод аст.

гурухи одамон табассум мекунанд

Маълумот синтетикӣ аст, аммо дастаи мо воқеӣ аст!

Бо Syntho тамос гиред ва яке аз коршиносони мо бо суръати рӯшноӣ бо шумо тамос мегирад, то арзиши маълумоти синтетикиро омӯзед!