Done sentetik ki te pwodwi pa Syntho evalye, valide ak apwouve nan yon pwen de vi ekstèn ak objektif pa ekspè done yo nan SAS.
Menmsi Syntho fyè pou l ofri itilizatè li yo yon rapò asirans kalite avanse, nou konprann tou enpòtans pou gen yon evalyasyon ekstèn ak objektif sou done sentetik nou yo nan men lidè endistri yo. Se poutèt sa nou kolabore ak SAS, lidè nan analytics, pou evalye done sentetik nou yo.
SAS fè plizyè evalyasyon apwofondi sou presizyon done, pwoteksyon vi prive, ak itilizasyon done sentetik AI Syntho yo te pwodwi an konparezon ak done orijinal yo. Kòm konklizyon, SAS te evalye ak apwouve done sentetik Syntho kòm yo te egzat, an sekirite, ak ka itilize an konparezon ak done orijinal yo.
Nou itilize done telecom ki itilize pou prediksyon "churn" kòm done sib. Objektif evalyasyon an se te sèvi ak done sentetik pou fòme divès modèl prediksyon churn ak evalye pèfòmans chak modèl. Kòm prediksyon churn se yon travay klasifikasyon, SAS te chwazi modèl klasifikasyon popilè pou fè prediksyon yo, tankou:
Anvan jenere done sentetik yo, SAS divize done telecom an owaza nan yon seri tren (pou fòmasyon modèl yo) ak yon seri holdout (pou fè nòt modèl yo). Èske w gen yon seri separe pou fè nòt pèmèt pou yon evalyasyon san patipri sou kouman modèl klasifikasyon an ta ka fè lè yo aplike nan nouvo done.
Lè l sèvi avèk seri tren an kòm opinyon, Syntho te itilize motè Syntho li yo pou jenere yon seri done sentetik. Pou benchmarking, SAS te kreye tou yon vèsyon anonim nan seri a tren apre yo fin aplike plizyè teknik anonimizasyon pou rive nan yon sèten papòt (nan k-anonimite). Ansyen etap yo te lakòz kat seri done:
Ansanm done 1, 3 ak 4 yo te itilize pou fòme chak modèl klasifikasyon, sa ki lakòz 12 (3 x 4) modèl fòmasyon. Answit SAS te itilize dataset holdout la pou mezire presizyon chak modèl nan prediksyon kliyan désabonnement.
SAS fè plizyè evalyasyon apwofondi sou presizyon done, pwoteksyon vi prive, ak itilizasyon done sentetik AI Syntho yo te pwodwi an konparezon ak done orijinal yo. Kòm konklizyon, SAS te evalye ak apwouve done sentetik Syntho kòm yo te egzat, an sekirite, ak ka itilize an konparezon ak done orijinal yo.
Done sentetik ki soti nan Syntho kenbe pa sèlman pou modèl debaz yo, li tou kaptire gwo twou san fon 'kache' modèl estatistik ki nesesè pou travay analiz avanse. Lèt la demontre nan tablo ba a, ki endike ke presizyon nan modèl ki resevwa fòmasyon sou done sentetik kont modèl ki resevwa fòmasyon sou done orijinal yo sanble. Pakonsekan, done sentetik yo ka itilize pou fòmasyon aktyèl nan modèl yo. Antre yo ak enpòtans varyab chwazi pa algoritm yo sou done sentetik konpare ak done orijinal yo te sanble anpil. Pakonsekan, li konkli ke pwosesis modèl la ka fè sou done sentetik, kòm yon altènativ pou itilize done reyèl sansib.
Teknik anonimizasyon klasik yo gen an komen ke yo manipile done orijinal yo nan lòd yo anpeche trase tounen moun. Yo manipile done epi kidonk detwi done nan pwosesis la. Plis ou anonimize, pi bon done ou yo pwoteje, men tou, plis done ou yo detwi. Sa a se sitou devaste pou travay AI ak modèl kote "pouvwa prediksyon" esansyèl, paske done move kalite pral lakòz move lide nan modèl AI a. SAS te demontre sa a, ak yon zòn anba koub la (AUC*) ki toupre 0.5, demontre ke modèl yo ki resevwa fòmasyon sou done anonim fè byen lwen pi mal la.
Korelasyon yo ak relasyon ant varyab yo te byen konsève nan done sentetik.
Zòn anba koub la (AUC), yon metrik pou mezire pèfòmans modèl la, te rete konsistan.
Anplis de sa, enpòtans varyab la, ki endike pouvwa prediksyon varyab nan yon modèl, te rete entak lè w konpare done sentetik ak done orijinal la.
Dapre obsèvasyon sa yo pa SAS ak lè nou itilize SAS Viya, nou ka konkli ke done sentetik ki te pwodwi pa motè Syntho a se tout bon par ak done reyèl an tèm de bon jan kalite. Sa a valide itilizasyon done sentetik pou devlopman modèl, pave wout la pou analiz avanse ak done sentetik.