Dàta gun urra an aghaidh dàta synthetach

Ma chuireas tu ainm ris an dàta agad mus dèan thu deuchainn dàta air anailis dàta, tha grunn nithean ann:

  1. Cha mhòr anns a h-uile cùis, faodar dàta gun urra a lorg fhathast air ais gu daoine fa leth air sgàth sreathan sònraichte agus sònraichte (me clàran meidigeach)
  2. Mar as motha a dh ’ainmicheas tu no a nì thu coitcheannachadh, is ann as motha de dhàta a sgriosas tu. Bidh seo a ’lughdachadh càileachd an dàta agad agus mar sin na beachdan agad
  3. Bidh gun urra ag obair gu eadar-dhealaichte airson diofar chruthan dàta. Tha seo a ’ciallachadh nach eil e scalable agus faodaidh e ùine mhòr a ghabhail

Bidh dàta synthetach a ’fuasgladh na h-uireasbhaidhean sin uile agus barrachd. Coimhead air a ’bhidio gu h-ìosal gus eòlaiche anailis bho SAS (stiùiriche margaidh cruinneil ann an anailisean) fhaicinn a’ mìneachadh mun mheasadh aige air an eadar-dhealachadh ann an càileachd eadar dàta tùsail, dàta gun urra agus le dàta synthetach a ghineadh le Syntho.

Tha a ’bhidio seo air a ghlacadh bhon Syntho x SAS D [N] Cafaidh mu dhàta synthetach ginte AI. Lorg am bhidio slàn an seo.

Chuir Edwin van Unen stòr-dàta tùsail gu Syntho agus rinn sinn co-chur air an dàta. Ach b’ i a’ cheist cuideachd: “Dè thachras ma nì sinn coimeas eadar dàta synthetigeach agus dàta gun urra?” Leis gu bheil thu a’ call tòrr fiosrachaidh ann an dàta gun urra, an tachair seo cuideachd nuair a bhios tu a’ co-chur stòr-dàta? Thòisich sinn le stòr-dàta bhon ghnìomhachas cian-conaltraidh le 56.000 sreathan agus 128 colbhan de fhiosrachadh maistreadh companaidh. Chaidh an dàta seo a cho-chur agus gun urra gus am b’ urrainn dha Edwin coimeas a dhèanamh eadar synthetization agus gun urra. An uairsin, thòisich Edwin air modaladh a’ cleachdadh SAS Viya. Thog e modal maistreadh no dhà air an t-seata dàta tùsail, a’ cleachdadh dòighean ath-thionndaidh clasaigeach agus craobhan co-dhùnaidh, ach cuideachd dòighean nas ionnsaichte leithid lìonraidhean neural, àrdachadh caisead, coille air thuaiream - na dòighean sin. A’ cleachdadh na roghainnean àbhaisteach SAS Viya nuair a bhios tu a’ togail nam modalan.

An uairsin, bha an t-àm ann coimhead air na toraidhean. Bha na toraidhean gu math gealltanach airson dàta synthetigeach agus chan ann airson gun urra. Dha na h-eòlaichean nach eil ag ionnsachadh inneal anns an luchd-èisteachd, bidh sinn a’ coimhead air an raon fon lùb ROC a tha ag innse rudeigin mu cho cinnteach sa tha am modail. A 'dèanamh coimeas eadar an dàta tùsail agus an dàta gun urra, chì sinn gu bheil raon aig a' mhodail dàta tùsail fon lùb ROC de .8, a tha gu math math, ge-tà, tha raon aig an dàta gun urra fon lùb ROC de .6. Tha seo a’ ciallachadh gun caill sinn tòrr fiosrachaidh leis a’ mhodail gun urra gus an caill thu tòrr cumhachd ro-innseach.

Ach an uairsin, is e a’ cheist dè mu dheidhinn dàta synthetics? An seo, rinn sinn an aon rud ach an àite a bhith gun urra ris an dàta, rinn Syntho an dàta a cho-chur. A-nis, chì sinn gu bheil raon aig an dà chuid an dàta tùsail agus an dàta synthetigeach fon lùb ROC de .8, a tha glè choltach. Chan e dìreach an aon rud air sgàth caochlaideachd, ach glè choltach. Tha seo a’ ciallachadh, tha comas dàta synthetigeach gu math gealltanach - tha Edwin glè thoilichte mu dheidhinn seo.

buidheann de dhaoine a’ gàireachdainn

Tha dàta synthetigeach, ach tha an sgioba againn fìor!

Cuir fios gu Syntho agus cuiridh aon de na h-eòlaichean againn fios thugad aig astar solais gus sgrùdadh a dhèanamh air luach dàta synthetigeach!