Nirxandina derveyî ya daneyên meya sentetîk ji hêla pisporên daneyê yên SAS ve

Daneyên me yên sentetîk e nirxandin û pejirandin ji hêla pisporên daneyan ve SAS

Danasîna nirxandina derveyî ya daneyên meya sentetîk ji hêla pisporên daneyê yên SAS ve

Me çi kir?

Daneyên sentetîk ên ku ji hêla Syntho ve têne hilberandin ji hêla pisporên daneyê yên SAS ve ji hêla derveyî û objektîf ve têne nirxandin, pejirandin û pejirandin.

Çima daneyên meya sentetîk ji derve ji hêla pisporên daneyê yên SAS ve têne nirxandin?

Her çend Syntho serbilind e ku ji bikarhênerên xwe re raporek pêbaweriya kalîteyê ya pêşkeftî pêşkêşî dike, em di heman demê de girîngiya nirxandinek derveyî û objektîf a daneyên meya sentetîk ji serokên pîşesaziyê fam dikin. Ji ber vê yekê em bi SAS re, serokê analîtîk, hevkariyê dikin da ku daneyên xweya sentetîk binirxînin.

SAS li ser rastbûna daneyê, parastina nepenîtiyê, û karanîna daneyên sentetîk ên AI-ê yên Syntho-yê li gorî daneyên orîjînal nirxandinên cûrbecûr pêk tîne. Wekî encam, SAS daneyên sentetîk ên Syntho wekî rast, ewledar û bikêrhatî li gorî daneyên orîjînal nirxand û pejirand.

SAS di vê nirxandinê de çi kir?

Me daneyên telekomê yên ku ji bo pêşbîniya "qurn" tê bikar anîn wekî daneyên armanc bikar anîn. Armanca nirxandinê ew bû ku daneyên sentetîk bikar bînin da ku modelên pêşbînkirina cûrbecûr perwerde bikin û performansa her modelê binirxînin. Ji ber ku pêşbîniya qutbûnê peywirek dabeşkirinê ye, SAS modelên dabeşkirina populer hilbijart da ku pêşbîniyan bike, di nav de:

Daristana Random
Zêdekirina gradient
Regresyona lojîstîk
Torê neural

Berî ku daneya sentetîk biafirîne, SAS bi rasthatinî daneheva telekomê li komek trênê (ji bo perwerdekirina modelan) û komeke hilanînê (ji bo pîvandina modelan) dabeş dike. Ji bo jimartinê veqetandek veqetandî rê dide nirxandinek bêalî li ser wê yekê ku modela dabeşkirinê dema ku li ser daneyên nû were sepandin çiqas baş dibe.

Bi karanîna seta trênê wekî têketinê, Syntho Motora xwe ya Syntho bikar anî da ku danehevek sentetîk çêbike. Ji bo pîvandinê, SAS di heman demê de guhertoyek anonîmkirî ya set trênê jî afirand piştî sepandina teknîkên cihêreng anonîmîzekirinê da ku bigihîje bergehek diyar (k-anonîmîteyê). Pêngavên berê di çar komên daneyan de encam dan:

Danûstendinek trênê (ango daneheva orîjînal ji bilî daneheva hilanînê)
Danûstendinek hilbijartî (ango binkeyek ji daneheva orîjînal)
Daneyên nenaskirî (daneyên nenaskirî yên daneheva trênê, daneya orîjînal ji bilî daneheva girtî)
Daneyên sentetîk (daneyên hevedudanî yên daneheva trênê, daneya orîjînal bêyî daneheva hilanînê)

Daneyên 1, 3 û 4 ji bo perwerdekirina her modela dabeşkirinê hatin bikar anîn, di encamê de 12 (3 x 4) modelên perwerdekirî derketin. Dûv re SAS databasa hilgirtinê bikar anî da ku rastbûna her modelê di pêşbîniya xerabûna xerîdar de bipîve.

Hûn pirs hene?

Bi yek ji pisporên me re bipeyivin

Paqij bûn

Encamên destpêkê yên nirxandina daneyên SAS

Modelên ku li ser daneyên sentetîk hatine perwerde kirin li gorî modelên ku li ser daneyên orjînal hatine perwerde kirin pir dişibin hev

Daneyên sentetîk ên ji Syntho ne tenê ji bo qalibên bingehîn digire, ew di heman demê de qalibên îstatîstîkî yên "veşartî" yên ku ji bo peywirên analîtîk ên pêşkeftî hewce ne jî digire. Ya paşîn di nexşeya bar de tê destnîşan kirin, ku destnîşan dike ku rastbûna modelên ku li ser daneyên sentetîk hatine perwerde kirin li hember modelên ku li ser daneyên orîjînal hatine perwerde kirin dişibin hev. Ji ber vê yekê, daneyên sentetîk dikare ji bo perwerdehiya rastîn a modelan were bikar anîn. Ketin û girîngiya guhêrbar ku ji hêla algorîtmayan ve li ser daneyên sentetîk hatine hilbijartin li gorî daneyên orîjînal pir dişibin hev. Ji ber vê yekê, tê encamdan ku pêvajoya modelkirinê dikare li ser daneyên sentetîk, wekî alternatîfek ji bo karanîna daneyên hesas ên rastîn were kirin.

Çima modelên ku li ser daneyên anonîm hatine perwerde kirin xirabtir dibin?

Teknîkên anonîmîzasyona klasîk hevpar in ku ew daneyên orîjînal manîpule dikin da ku rê li ber şopandina kesan bigirin. Ew daneyan manîpule dikin û bi vî rengî di pêvajoyê de daneyan hilweşînin. Her ku hûn anonîm bikin, daneyên we çêtir têne parastin, lê di heman demê de bêtir daneyên we têne hilweşandin. Ev bi taybetî ji bo AI-ê û karên modelkirinê yên ku "hêza pêşbîniyê" bingehîn e, wêranker e, ji ber ku daneyên kalîteya xirab dê ji modela AI-ê têgihîştinên xirab derxe holê. SAS vê yekê destnîşan kir, bi deverek di binê xêzikê de (AUC*) nêzî 0.5 e, û destnîşan kir ku modelên ku li ser daneyên nenaskirî hatine perwerde kirin heya niha ya herî xirab pêk tînin.

Encamên zêde yên nirxandinên daneya sentetîk ji hêla SAS ve

Têkilî û têkiliyên di navbera guherbaran de rast di daneyên sentetîk de hatine parastin.

Qada Di bin Curve (AUC), metricek ji bo pîvandina performansa modelê, domdar ma.

Digel vê yekê, girîngiya guhêrbar, ku hêza pêşbînîker a guhêrbaran di modelekê de destnîşan dike, dema ku daneyên sentetîk bi daneya orîjînal re berhev dike, sax ma.

Li ser bingeha van çavdêriyên ji hêla SAS ve û bi karanîna SAS Viya ve, em dikarin bi pêbawerî encam bidin ku daneyên sentetîk ên ku ji hêla Syntho Engine ve têne hilberandin bi rastî di warê kalîteyê de li gorî daneyên rastîn e. Ev karanîna daneyên sentetîk ji bo pêşkeftina modelê rast dike, bi daneyên sentetîk rê li ber analîtîkên pêşkeftî vedike.

Encamên pisporên daneyên SAS

Modelên ku li ser daneyên sentetîk hatine perwerde kirin li gorî modelên ku li ser daneyên orjînal hatine perwerde kirin performansa pir dişibin hev nîşan didin
Modelên ku li ser daneyên nenaskirî yên bi 'teknîkên anonîmîzasyona klasîk' hatine perwerdekirin li gorî modelên ku li ser daneyên orîjînal an daneyên sentetîk hatine perwerde kirin performansa hindiktir nîşan didin.
Hilberîna daneya sentetîk hêsan û bilez e ji ber ku teknîk ji her databasê û ji her celebê daneyê bi heman rengî dixebite

Daneyên me yên sentetîk e pejirandin ji hêla pisporên daneyên SAS ve

Gotara bixwînin

Gotarên referansê

Nirxandina pisporên daneyên SAS: https://blogs.sas.com/content/hiddeninsights/2022/07/07/ai-generated-synthetic-data-easy-and-fast-access-to-high-quality-data/

Syntho serketî ya hackathona gerdûnî ya SAS: https://www.linkedin.com/feed/update/urn:li:activity:7070047376249376769/
Encamên lêkolîna doza lênihêrîna tenduristiyê: https://communities.sas.com/t5/SAS-Hacker-s-Hub/AI-Generated-Synthetic-Data-in-Healthcare/ta-p/863407

Daneyên sentetîk çi ye?

Rapora ewlehiya kalîteyê

Nirxandina derve ji aliyê SAS

Daneyên sentetîk rêzikên dem

PII Scanner

Daneyên Mock Sentetîk

Nexşeya hevgirtî

De-nasname û sentetîzasyon

Daneyên Synthetic-based Rule

Subsetting

Bicihkirin û entegrasyonê

Connectors

Taybetmendiyên berfireh

Daneyên piştgirî kirin

Belgeyên bikarhêner

Demoyek plansaz bikin

Pricing

Daneyên testê

Analytics

Data sharing

Demo hilberê

Diravkirina daneyan

Parastina saxlemîyê

Malî

Rêxistinên Giştî

Belgeyên bikarhêner

Pirtûkên spî û rêber

Blog

Webinars

Lêkolîn Case

Pricing

Çûna nava

Careers

Nirxandina derveyî ya daneyên meya sentetîk ji hêla pisporên daneyê yên SAS ve

Daneyên me yên sentetîk e nirxandin û pejirandin ji hêla pisporên daneyan ve SAS

Danasîna nirxandina derveyî ya daneyên meya sentetîk ji hêla pisporên daneyê yên SAS ve

Me çi kir?

Çima daneyên meya sentetîk ji derve ji hêla pisporên daneyê yên SAS ve têne nirxandin?

SAS di vê nirxandinê de çi kir?

Hûn pirs hene?

Bi yek ji pisporên me re bipeyivin

Encamên destpêkê yên nirxandina daneyên SAS

Modelên ku li ser daneyên sentetîk hatine perwerde kirin li gorî modelên ku li ser daneyên orjînal hatine perwerde kirin pir dişibin hev

Çima modelên ku li ser daneyên anonîm hatine perwerde kirin xirabtir dibin?

Encamên zêde yên nirxandinên daneya sentetîk ji hêla SAS ve

Encamên zêde yên nirxandinên daneya sentetîk ji hêla SAS ve

Encamên pisporên daneyên SAS

Daneyên me yên sentetîk e pejirandin ji hêla pisporên daneyên SAS ve

Gotarên referansê

Naha rêberê daneya sentetîk hilînin!

main Menu

Naha rêberê daneya sentetîk hilînin!