A Syntho minőségbiztosítási jelentése értékeli a generált szintetikus adatokat, és bemutatja a szintetikus adatok pontosságát, titkosságát és sebességét az eredeti adatokhoz képest.
A Synthonál megértjük a megbízható és pontos szintetikus adatok fontosságát. Ezért minden szintetikus adatfuttatásról átfogó minőségbiztosítási jelentést készítünk. Minőségi jelentésünk különféle mérőszámokat tartalmaz, például eloszlásokat, korrelációkat, többváltozós eloszlásokat, adatvédelmi mutatókat stb. Így könnyen felmérheti, hogy az általunk szolgáltatott szintetikus adatok a legjobb minőségűek, és ugyanolyan pontossággal és megbízhatósággal használhatók-e, mint az eredeti adatok.
Egy pillantás megörökítése: ez a rész a szintetikus adatminőségi jelentésünk legfontosabb elemeit szemlélteti. Értékeléseink a szintetikus adatokat a valós adatokkal összehasonlítva vizsgálják különböző dimenziókban.
A szintetikus adatgenerálás bonyolult, és vannak buktatók, amelyeket ellenőrizni kell. Az AI-algoritmusok esetében a túlillesztés kockázatot jelent, és ez a helyzet a mesterséges intelligencia segítségével történő szintetikus adatgenerálásnál is. Ezért a szintetikus adatok generálásakor ellenőrizni kell a túlillesztés kockázatát. A túlillesztés kockázatát a Syntho Engine szabályozza. Ráadásul a Syntho Quality Assurance (QA) jelentés lehetővé teszi a szervezetek számára, hogy igazolják, hogy a szintetikus adatok nem illeszkedtek túl az eredeti adatokhoz. Több adatvédelemmel kapcsolatos szempontot is értékelünk, amelyet gyakran használnak a belső ellenőrök.
Teszt a „pontos egyezéseken” az azonos egyezési aránnyal (IMR)
Annak bemutatása, hogy az eredeti adatokból egy valós rekordnak megfelelő szintetikus adatrekordok aránya nem haladja meg szignifikánsan azt az arányt, amely a vonatadatok elemzésekor várható.
Teszt be „Hasonló mérkőzések” a távolság a legközelebbi rekordig (DCR)
Annak bemutatása, hogy a szintetikus adatrekordok normalizált távolsága az eredeti adatokon belüli legközelebbi tényleges rekordjuktól nem lényegesen közelebb van ahhoz a távolsághoz, amely a vonatadatok elemzésekor várható.
Teszt be „Kiugró értékek” a Legközelebbi szomszéd távolság aránya (NNDR)
Annak bizonyítása, hogy a legközelebbi és a második legközelebbi szintetikus rekord és a legközelebbi rekord közötti távolság aránya az eredeti adatokon belül nem lényegesen közelebb van a vonatadatokhoz várható arányhoz.
Ez csak egy pillanatkép, amely összefoglalja szintetikus adatminőség-feltáró és minőségbiztosítási jelentésünk lényegét. A szintetikus adatok részeként árnyalt megértést kínál a disztribúciókról, összefüggésekről és többváltozós disztribúciókról, amelyeket a Syntho Engine fejlett képességei rögzítenek. Minőségbiztosítási jelentésünkről kérésre további részletek is elérhetők.