Nirxandina derveyî ya daneyên meya sentetîk ji hêla pisporên daneyê yên SAS ve

Daneyên me yên sentetîk e nirxandin û pejirandin ji hêla pisporên daneyan ve SAS

Danasîna nirxandina derveyî ya daneyên meya sentetîk ji hêla pisporên daneyê yên SAS ve

Me çi kir?

Daneyên sentetîk ên ku ji hêla Syntho ve têne hilberandin ji hêla pisporên daneyê yên SAS ve ji hêla derveyî û objektîf ve têne nirxandin, pejirandin û pejirandin.

Çima daneyên meya sentetîk ji derve ji hêla pisporên daneyê yên SAS ve têne nirxandin?

Her çend Syntho serbilind e ku ji bikarhênerên xwe re raporek pêbaweriya kalîteyê ya pêşkeftî pêşkêşî dike, em di heman demê de girîngiya nirxandinek derveyî û objektîf a daneyên meya sentetîk ji serokên pîşesaziyê fam dikin. Ji ber vê yekê em bi SAS re, serokê analîtîk, hevkariyê dikin da ku daneyên xweya sentetîk binirxînin.

SAS li ser rastbûna daneyê, parastina nepenîtiyê, û karanîna daneyên sentetîk ên AI-ê yên Syntho-yê li gorî daneyên orîjînal nirxandinên cûrbecûr pêk tîne. Wekî encam, SAS daneyên sentetîk ên Syntho wekî rast, ewledar û bikêrhatî li gorî daneyên orîjînal nirxand û pejirand.

SAS di vê nirxandinê de çi kir?

Me daneyên telekomê yên ku ji bo pêşbîniya "qurn" tê bikar anîn wekî daneyên armanc bikar anîn. Armanca nirxandinê ew bû ku daneyên sentetîk bikar bînin da ku modelên pêşbînkirina cûrbecûr perwerde bikin û performansa her modelê binirxînin. Ji ber ku pêşbîniya qutbûnê peywirek dabeşkirinê ye, SAS modelên dabeşkirina populer hilbijart da ku pêşbîniyan bike, di nav de:

  1. Daristana Random
  2. Zêdekirina gradient
  3. Regresyona lojîstîk
  4. Torê neural

Berî ku daneya sentetîk biafirîne, SAS bi rasthatinî daneheva telekomê li komek trênê (ji bo perwerdekirina modelan) û komeke hilanînê (ji bo pîvandina modelan) dabeş dike. Ji bo jimartinê veqetandek veqetandî rê dide nirxandinek bêalî li ser wê yekê ku modela dabeşkirinê dema ku li ser daneyên nû were sepandin çiqas baş dibe.

Bi karanîna seta trênê wekî têketinê, Syntho Motora xwe ya Syntho bikar anî da ku danehevek sentetîk çêbike. Ji bo pîvandinê, SAS di heman demê de guhertoyek anonîmkirî ya set trênê jî afirand piştî sepandina teknîkên cihêreng anonîmîzekirinê da ku bigihîje bergehek diyar (k-anonîmîteyê). Pêngavên berê di çar komên daneyan de encam dan:

  1. Danûstendinek trênê (ango daneheva orîjînal ji bilî daneheva hilanînê)
  2. Danûstendinek hilbijartî (ango binkeyek ji daneheva orîjînal)
  3. Daneyên nenaskirî (daneyên nenaskirî yên daneheva trênê, daneya orîjînal ji bilî daneheva girtî)
  4. Daneyên sentetîk (daneyên hevedudanî yên daneheva trênê, daneya orîjînal bêyî daneheva hilanînê)

Daneyên 1, 3 û 4 ji bo perwerdekirina her modela dabeşkirinê hatin bikar anîn, di encamê de 12 (3 x 4) modelên perwerdekirî derketin. Dûv re SAS databasa hilgirtinê bikar anî da ku rastbûna her modelê di pêşbîniya xerabûna xerîdar de bipîve.

SAS li ser rastbûna daneyê, parastina nepenîtiyê, û karanîna daneyên sentetîk ên AI-ê yên Syntho-yê li gorî daneyên orîjînal nirxandinên cûrbecûr pêk tîne. Wekî encam, SAS daneyên sentetîk ên Syntho wekî rast, ewledar û bikêrhatî li gorî daneyên orîjînal nirxand û pejirand.

Hûn pirs hene?

Bi yek ji pisporên me re bipeyivin

Encamên destpêkê yên nirxandina daneyên SAS

Modelên ku li ser daneyên sentetîk hatine perwerde kirin li gorî modelên ku li ser daneyên orjînal hatine perwerde kirin pir dişibin hev

Daneyên sentetîk ên ji Syntho ne tenê ji bo qalibên bingehîn digire, ew di heman demê de qalibên îstatîstîkî yên "veşartî" yên ku ji bo peywirên analîtîk ên pêşkeftî hewce ne jî digire. Ya paşîn di nexşeya bar de tê destnîşan kirin, ku destnîşan dike ku rastbûna modelên ku li ser daneyên sentetîk hatine perwerde kirin li hember modelên ku li ser daneyên orîjînal hatine perwerde kirin dişibin hev. Ji ber vê yekê, daneyên sentetîk dikare ji bo perwerdehiya rastîn a modelan were bikar anîn. Ketin û girîngiya guhêrbar ku ji hêla algorîtmayan ve li ser daneyên sentetîk hatine hilbijartin li gorî daneyên orîjînal pir dişibin hev. Ji ber vê yekê, tê encamdan ku pêvajoya modelkirinê dikare li ser daneyên sentetîk, wekî alternatîfek ji bo karanîna daneyên hesas ên rastîn were kirin.

Çima modelên ku li ser daneyên anonîm hatine perwerde kirin xirabtir dibin?

Teknîkên anonîmîzasyona klasîk hevpar in ku ew daneyên orîjînal manîpule dikin da ku rê li ber şopandina kesan bigirin. Ew daneyan manîpule dikin û bi vî rengî di pêvajoyê de daneyan hilweşînin. Her ku hûn anonîm bikin, daneyên we çêtir têne parastin, lê di heman demê de bêtir daneyên we têne hilweşandin. Ev bi taybetî ji bo AI-ê û karên modelkirinê yên ku "hêza pêşbîniyê" bingehîn e, wêranker e, ji ber ku daneyên kalîteya xirab dê ji modela AI-ê têgihîştinên xirab derxe holê. SAS vê yekê destnîşan kir, bi deverek di binê xêzikê de (AUC*) nêzî 0.5 e, û destnîşan kir ku modelên ku li ser daneyên nenaskirî hatine perwerde kirin heya niha ya herî xirab pêk tînin.

Encamên zêde yên nirxandinên daneya sentetîk ji hêla SAS ve

Encamên zêde yên nirxandinên daneya sentetîk ji hêla SAS ve

Têkilî û têkiliyên di navbera guherbaran de rast di daneyên sentetîk de hatine parastin.

Qada Di bin Curve (AUC), metricek ji bo pîvandina performansa modelê, domdar ma.

Digel vê yekê, girîngiya guhêrbar, ku hêza pêşbînîker a guhêrbaran di modelekê de destnîşan dike, dema ku daneyên sentetîk bi daneya orîjînal re berhev dike, sax ma.

Li ser bingeha van çavdêriyên ji hêla SAS ve û bi karanîna SAS Viya ve, em dikarin bi pêbawerî encam bidin ku daneyên sentetîk ên ku ji hêla Syntho Engine ve têne hilberandin bi rastî di warê kalîteyê de li gorî daneyên rastîn e. Ev karanîna daneyên sentetîk ji bo pêşkeftina modelê rast dike, bi daneyên sentetîk rê li ber analîtîkên pêşkeftî vedike.

Encamên pisporên daneyên SAS

Sas logo

Daneyên me yên sentetîk e pejirandin ji hêla pisporên daneyên SAS ve

Gotarên referansê

cover rêberê syntho

Naha rêberê daneya sentetîk hilînin!