Meastóireacht sheachtrach ar ár sonraí sintéiseacha ag saineolaithe sonraí SAS

Is é ár sonraí sintéiseacha measúnú agus ceadaithe ag saineolaithe sonraí ó SAS

Réamhrá don mheastóireacht sheachtrach ar ár sonraí sintéiseacha ag saineolaithe sonraí SAS

Cad a rinne muid?

Déanann saineolaithe sonraí SAS na sonraí sintéiseacha a ghineann Syntho a mheasúnú, a bhailíochtú agus a fhormheas ó dhearcadh seachtrach agus oibiachtúil.

Cén fáth a ndéanann saineolaithe sonraí SAS measúnú seachtrach ar ár gcuid sonraí sintéiseacha?

Cé go bhfuil Syntho bródúil as ardtuarascáil dearbhaithe cáilíochta a thairiscint dá úsáideoirí, tuigimid freisin an tábhacht a bhaineann le meastóireacht sheachtrach agus oibiachtúil a bheith againn ar ár sonraí sintéiseacha ó cheannairí tionscail. Sin an fáth a n-oibrímid le SAS, ceannaire san anailísíocht, chun ár sonraí sintéiseacha a mheasúnú.

Déanann SAS meastóireachtaí críochnúla éagsúla ar chruinneas sonraí, cosaint príobháideachta, agus inúsáidteacht sonraí sintéiseacha a ghintear le AI Syntho i gcomparáid leis na sonraí bunaidh. Mar chonclúid, rinne SAS measúnú agus faomhadh ar shonraí sintéiseacha Syntho a bheith cruinn, slán, agus inúsáidte i gcomparáid leis na sonraí bunaidh.

Cad a rinne SAS le linn an mheasúnaithe seo?

D’úsáideamar sonraí teileachumarsáide a úsáidtear le haghaidh tuar “churn” mar shonraí sprice. Ba é sprioc na meastóireachta sonraí sintéiseacha a úsáid chun múnlaí éagsúla tuar maisteoige a oiliúint agus chun feidhmíocht gach samhla a mheas. Toisc gur tasc aicmithe é tuar chuinneog, roghnaigh SAS samhlacha aicmithe móréilimh chun na tuartha a dhéanamh, lena n-áirítear:

  1. Foraois randamach
  2. Treisiú grádán
  3. Aischéimniú lóistíochta
  4. Líonra Neural

Sular gineadh na sonraí sintéiseacha, rinne SAS an tacar sonraí teileachumarsáide a roinnt go randamach ina thacar traenach (chun na samhlacha a oiliúint) agus ina thacar coinneála (chun na samhlacha a scóráil). Is féidir measúnú neamhchlaonta a dhéanamh ar cé chomh maith agus a d'fhéadfadh an tsamhail aicmithe a dhéanamh nuair a chuirtear i bhfeidhm ar shonraí nua é má bhíonn sraith coinneála ar leith ann.

Ag baint úsáide as an tsraith traenach mar ionchur, d'úsáid Syntho a Inneall Syntho chun tacar sonraí sintéiseacha a ghiniúint. Maidir le tagarmharcáil, chruthaigh SAS leagan anaithnid den fhoireann traenach tar éis teicnící éagsúla anaithnidithe a chur i bhfeidhm chun tairseach áirithe (k-anaithnideacht) a bhaint amach. Bhí ceithre thacar sonraí mar thoradh ar na chéad chéimeanna:

  1. Tacar sonraí traenach (.i. an tacar sonraí bunaidh lúide an tacar sonraí coinneála)
  2. Tacar sonraí coinneála (.i. fothacar den bhunthacar sonraí)
  3. Tacar sonraí gan ainm (sonraí anaithnide de thacar sonraí na traenach, an bhunthacar sonraí lúide an tacar sonraí coinneála)
  4. Tacar sonraí sintéiseach (sonraí sintéiseithe de thacar sonraí na traenach, buntacar sonraí lúide an tacar sonraí coinneála)

Baineadh úsáid as tacair sonraí 1, 3 agus 4 chun gach samhail aicmithe a oiliúint, agus mar thoradh air sin bhí 12 (3 x 4) múnla oilte. D’úsáid SAS an tacar sonraí coinneála ina dhiaidh sin chun cruinneas gach múnla a thomhas maidir le hathrú custaiméara a thuar.

Déanann SAS meastóireachtaí críochnúla éagsúla ar chruinneas sonraí, cosaint príobháideachta, agus inúsáidteacht sonraí sintéiseacha a ghintear le AI Syntho i gcomparáid leis na sonraí bunaidh. Mar chonclúid, rinne SAS measúnú agus faomhadh ar shonraí sintéiseacha Syntho a bheith cruinn, slán, agus inúsáidte i gcomparáid leis na sonraí bunaidh.

An bhfuil aon cheist agat?

Labhair le duine dár saineolaithe

Torthaí tosaigh an mheasúnaithe sonraí ag SAS

Scóráil múnlaí a bhfuil oiliúint orthu ar shonraí sintéiseacha an-chosúil i gcomparáid le samhlacha a fuair oiliúint ar bhunshonraí

Coinníonn sonraí sintéiseacha ó Syntho ní hamháin do phatrúin bhunúsacha, sealbhaíonn sé patrúin staitistiúla dhomhain 'i bhfolach' a theastaíonn le haghaidh ardtascanna anailíse. Léirítear an dara ceann sa bharrachairt, rud a thugann le fios go bhfuil cruinneas na múnlaí a gcuirtear oiliúint orthu ar shonraí sintéiseacha agus na samhlacha a oiliúint ar bhunshonraí comhchosúil. Mar sin, is féidir sonraí sintéiseacha a úsáid le haghaidh oiliúint iarbhír na múnlaí. Bhí na hionchuir agus an tábhacht athraitheach a roghnaigh na halgartaim ar shonraí sintéiseacha i gcomparáid le sonraí bunaidh an-chosúil. Mar sin, tá sé de chonclúid gur féidir an próiseas samhaltaithe a dhéanamh ar shonraí sintéiseacha, mar mhalairt ar úsáid a bhaint as fíor-shonraí íogaire.

Cén fáth a mbíonn scór níos measa ag samhlacha atá oilte ar shonraí gan ainm?

Is é an rud is coiteann do theicnící clasaiceacha anaithnidithe ná go n-ionramhálann siad bunshonraí chun bac a chur ar dhaoine aonair a lorg ar ais. Déanann siad sonraí a ionramháil agus mar sin scriosann siad sonraí sa phróiseas. Dá mhéad a dhéanann tú anaithnid, is amhlaidh is fearr a chosnaítear do shonraí, ach is amhlaidh is mó a scriostar do shonraí. Tá sé seo thar a bheith tubaisteach do thascanna AI agus samhaltú ina bhfuil “cumhacht thuarthach” riachtanach, mar go mbeidh droch-léargais ón tsamhail AI mar thoradh ar shonraí droch-chaighdeán. Léirigh SAS é seo, agus achar faoin gcuar (AUC*) gar do 0.5, rud a léirigh gurb iad na samhlacha atá oilte ar shonraí gan ainm is measa i bhfad.

Torthaí breise ar mheasúnuithe ar shonraí sintéiseacha arna ndéanamh ag SAS

Torthaí breise ar mheasúnuithe ar shonraí sintéiseacha arna ndéanamh ag SAS

Caomhnaíodh na comhghaolta agus na caidrimh idir athróga go cruinn i sonraí sintéiseacha.

D'fhan an tAchar Faoin gCuar (AUC), méadrach chun feidhmíocht samhla a thomhas, comhsheasmhach.

Ina theannta sin, d’fhan an tábhacht inathraithe, a léirigh cumhacht thuarthach na n-athróg i múnla, slán agus sonraí sintéiseacha á gcur i gcomparáid leis an mbunshonraí sonraí.

Bunaithe ar na breathnuithe seo ó SAS agus trí úsáid a bhaint as SAS Viya, is féidir linn a chinneadh go muiníneach go bhfuil na sonraí sintéiseacha a ghineann an Syntho Engine ar chomhchéim le fíor-shonraí i dtéarmaí cáilíochta. Déanann sé seo bailíochtú ar úsáid sonraí sintéiseacha chun samhlacha a fhorbairt, rud a réitigh an bealach d’ardanailísíocht le sonraí sintéiseacha.

Conclúidí ó shaineolaithe sonraí SAS

Lógó Sas

Is é ár sonraí sintéiseacha ceadaithe ag saineolaithe sonraí SAS

Ailt tagartha

clúdach treoir sintéise

Sábháil do threoir sonraí sintéiseacha anois!