Déanann saineolaithe sonraí SAS na sonraí sintéiseacha a ghineann Syntho a mheasúnú, a bhailíochtú agus a fhormheas ó dhearcadh seachtrach agus oibiachtúil.
Cé go bhfuil Syntho bródúil as ardtuarascáil dearbhaithe cáilíochta a thairiscint dá úsáideoirí, tuigimid freisin an tábhacht a bhaineann le meastóireacht sheachtrach agus oibiachtúil a bheith againn ar ár sonraí sintéiseacha ó cheannairí tionscail. Sin an fáth a n-oibrímid le SAS, ceannaire san anailísíocht, chun ár sonraí sintéiseacha a mheasúnú.
Déanann SAS meastóireachtaí críochnúla éagsúla ar chruinneas sonraí, cosaint príobháideachta, agus inúsáidteacht sonraí sintéiseacha a ghintear le AI Syntho i gcomparáid leis na sonraí bunaidh. Mar chonclúid, rinne SAS measúnú agus faomhadh ar shonraí sintéiseacha Syntho a bheith cruinn, slán, agus inúsáidte i gcomparáid leis na sonraí bunaidh.
D’úsáideamar sonraí teileachumarsáide a úsáidtear le haghaidh tuar “churn” mar shonraí sprice. Ba é sprioc na meastóireachta sonraí sintéiseacha a úsáid chun múnlaí éagsúla tuar maisteoige a oiliúint agus chun feidhmíocht gach samhla a mheas. Toisc gur tasc aicmithe é tuar chuinneog, roghnaigh SAS samhlacha aicmithe móréilimh chun na tuartha a dhéanamh, lena n-áirítear:
Sular gineadh na sonraí sintéiseacha, rinne SAS an tacar sonraí teileachumarsáide a roinnt go randamach ina thacar traenach (chun na samhlacha a oiliúint) agus ina thacar coinneála (chun na samhlacha a scóráil). Is féidir measúnú neamhchlaonta a dhéanamh ar cé chomh maith agus a d'fhéadfadh an tsamhail aicmithe a dhéanamh nuair a chuirtear i bhfeidhm ar shonraí nua é má bhíonn sraith coinneála ar leith ann.
Ag baint úsáide as an tsraith traenach mar ionchur, d'úsáid Syntho a Inneall Syntho chun tacar sonraí sintéiseacha a ghiniúint. Maidir le tagarmharcáil, chruthaigh SAS leagan anaithnid den fhoireann traenach tar éis teicnící éagsúla anaithnidithe a chur i bhfeidhm chun tairseach áirithe (k-anaithnideacht) a bhaint amach. Bhí ceithre thacar sonraí mar thoradh ar na chéad chéimeanna:
Baineadh úsáid as tacair sonraí 1, 3 agus 4 chun gach samhail aicmithe a oiliúint, agus mar thoradh air sin bhí 12 (3 x 4) múnla oilte. D’úsáid SAS an tacar sonraí coinneála ina dhiaidh sin chun cruinneas gach múnla a thomhas maidir le hathrú custaiméara a thuar.
Déanann SAS meastóireachtaí críochnúla éagsúla ar chruinneas sonraí, cosaint príobháideachta, agus inúsáidteacht sonraí sintéiseacha a ghintear le AI Syntho i gcomparáid leis na sonraí bunaidh. Mar chonclúid, rinne SAS measúnú agus faomhadh ar shonraí sintéiseacha Syntho a bheith cruinn, slán, agus inúsáidte i gcomparáid leis na sonraí bunaidh.
Coinníonn sonraí sintéiseacha ó Syntho ní hamháin do phatrúin bhunúsacha, sealbhaíonn sé patrúin staitistiúla dhomhain 'i bhfolach' a theastaíonn le haghaidh ardtascanna anailíse. Léirítear an dara ceann sa bharrachairt, rud a thugann le fios go bhfuil cruinneas na múnlaí a gcuirtear oiliúint orthu ar shonraí sintéiseacha agus na samhlacha a oiliúint ar bhunshonraí comhchosúil. Mar sin, is féidir sonraí sintéiseacha a úsáid le haghaidh oiliúint iarbhír na múnlaí. Bhí na hionchuir agus an tábhacht athraitheach a roghnaigh na halgartaim ar shonraí sintéiseacha i gcomparáid le sonraí bunaidh an-chosúil. Mar sin, tá sé de chonclúid gur féidir an próiseas samhaltaithe a dhéanamh ar shonraí sintéiseacha, mar mhalairt ar úsáid a bhaint as fíor-shonraí íogaire.
Is é an rud is coiteann do theicnící clasaiceacha anaithnidithe ná go n-ionramhálann siad bunshonraí chun bac a chur ar dhaoine aonair a lorg ar ais. Déanann siad sonraí a ionramháil agus mar sin scriosann siad sonraí sa phróiseas. Dá mhéad a dhéanann tú anaithnid, is amhlaidh is fearr a chosnaítear do shonraí, ach is amhlaidh is mó a scriostar do shonraí. Tá sé seo thar a bheith tubaisteach do thascanna AI agus samhaltú ina bhfuil “cumhacht thuarthach” riachtanach, mar go mbeidh droch-léargais ón tsamhail AI mar thoradh ar shonraí droch-chaighdeán. Léirigh SAS é seo, agus achar faoin gcuar (AUC*) gar do 0.5, rud a léirigh gurb iad na samhlacha atá oilte ar shonraí gan ainm is measa i bhfad.
Caomhnaíodh na comhghaolta agus na caidrimh idir athróga go cruinn i sonraí sintéiseacha.
D'fhan an tAchar Faoin gCuar (AUC), méadrach chun feidhmíocht samhla a thomhas, comhsheasmhach.
Ina theannta sin, d’fhan an tábhacht inathraithe, a léirigh cumhacht thuarthach na n-athróg i múnla, slán agus sonraí sintéiseacha á gcur i gcomparáid leis an mbunshonraí sonraí.
Bunaithe ar na breathnuithe seo ó SAS agus trí úsáid a bhaint as SAS Viya, is féidir linn a chinneadh go muiníneach go bhfuil na sonraí sintéiseacha a ghineann an Syntho Engine ar chomhchéim le fíor-shonraí i dtéarmaí cáilíochta. Déanann sé seo bailíochtú ar úsáid sonraí sintéiseacha chun samhlacha a fhorbairt, rud a réitigh an bealach d’ardanailísíocht le sonraí sintéiseacha.