Syntho-ren kalitatea bermatzeko txostenak sortutako datu sintetikoak ebaluatzen ditu eta datu sintetikoen zehaztasuna, pribatutasuna eta abiadura erakusten ditu jatorrizko datuekin alderatuta.
Synthon, datu sintetiko fidagarri eta zehatzen garrantzia ulertzen dugu. Horregatik, datu sintetikoen exekuzio bakoitzeko kalitatea bermatzeko txosten integrala eskaintzen dugu. Gure kalitate-txostenak hainbat neurketa biltzen ditu, hala nola, banaketak, korrelazioak, aldagai anitzeko banaketak, pribatutasun-neurriak eta abar. Horrela, erraz baloratu ahal izango duzu eskaintzen ditugun datu sintetikoak kalitate gorenekoa direla eta zure jatorrizko datuen zehaztasun eta fidagarritasun maila berdinarekin erabil daitezkeela.
Ikuspegi bat ateratzea: atal honek gure datu sintetikoen kalitate-txostenaren aipagarrienak erakusten ditu. Gure ebaluazioek datu sintetikoak aztertzen dituzte datu errealekin alderatuta hainbat dimentsiotan.
Datu sintetikoak sortzea konplexua da eta hutsuneak existitzen dira eta kontrolatu behar dira. AI algoritmoekin, gehiegizko egokitzea arriskua da eta hori ere gertatzen da AIarekin datu sintetikoen sorreran. Hori dela eta, datu sintetikoak sortzean gehiegi egokitzeko arriskua kontrolatu behar da. Gehiegi egokitzeko arriskua Syntho Engine-n kontrolatzen da. Horrez gain, Syntho Quality Assurance (QA) txostenak aukera ematen die erakundeei datu sintetikoak jatorrizko datuekin gehiegi egokitzen ez direla frogatzeko. Pribatutasunarekin lotutako alderdi gehiago ere ebaluatzen ditugu, barne-ikuskariek sarri erabiltzen dituztenak.
Proba bat-etortze zehatzak (IMR) berdin-berdinarekin
Jatorrizko datuekin bat datozen datu sintetikoen erregistroen ratioa ez dela trenaren datuak aztertzean espero daitekeen ratioa baino nabarmen handiagoa.
Proba martxan "Antzeko partiduak" Distantzia hurbileneko erregistroarekin (DCR)
Datu sintetikoen erregistroen distantzia normalizatua jatorrizko datuen barneko benetako erregistrotik hurbilen dagoen distantzia ez dela trenaren datuak aztertzean espero daitekeen distantzia baino nabarmen hurbilago dagoela frogatzea.
Proba martxan "Outliers"-rekin Hurbilen dagoen bizilagunen distantzia ratioa (NNDR)
Erakusketa: Erregistro sintetiko hurbilenaren eta bigarren hurbilenaren arteko distantzia-erlazioa jatorrizko datuen barruan haien erregistro hurbilenaren arteko distantzia-erlazioa ez dela trenaren datuetarako espero daitekeen ratioa baino nabarmen hurbilagoa.
Hau gure datu sintetikoen kalitatearen esplorazio eta kalitatea bermatzeko txostenaren funtsa laburbiltzen duen argazki bat baino ez da. Banaketa, korrelazio eta aldagai anitzeko banaketak ulertzeko ñabardura eskaintzen du Syntho Engine-ren gaitasun aurreratuek jasotako datu sintetikoen parte gisa. Gure kalitatea bermatzeko txostenari buruzko xehetasun gehiago eskatuz gero.