Synthos kvalitetssikringsrapport vurderer genererede syntetiske data og demonstrerer nøjagtigheden, privatlivets fred og hastigheden af de syntetiske data sammenlignet med de originale data.
Hos Syntho forstår vi vigtigheden af pålidelige og nøjagtige syntetiske data. Det er derfor, vi leverer en omfattende kvalitetssikringsrapport for hver syntetisk datakørsel. Vores kvalitetsrapport indeholder forskellige metrics såsom distributioner, korrelationer, multivariate distributioner, privatlivsmetrics og mere. På denne måde kan du nemt vurdere, at de syntetiske data, vi leverer, er af højeste kvalitet og kan bruges med samme grad af nøjagtighed og pålidelighed som dine originale data.
Få et glimt: Dette afsnit illustrerer højdepunkter fra vores kvalitetsrapport om syntetiske data. Vores vurderinger undersøger de syntetiske data i sammenligning med de reelle data på tværs af forskellige dimensioner.
Syntetiske data Multivariate distributioner i sammenligning med virkelige data
Multivariate fordelinger og multivariate korrelationer tager os ud over singulære dimensioner, hvilket giver et omfattende overblik over, hvordan flere variable er relateret. Syntho-motoren fanger disse relationer.
Syntetisk datagenerering er kompleks, og faldgruber findes og skal kontrolleres for. Med AI-algoritmer er overfitting en risiko, og det er også tilfældet for syntetisk datagenerering med AI. Derfor bør man kontrollere for risikoen for overfitting, når der genereres syntetiske data. Risikoen for overmontering er kontrolleret i Syntho Engine. Derudover giver Syntho Quality Assurance-rapporten (QA) organisationer mulighed for at demonstrere, at de syntetiske data ikke passer til de originale data. Vi vurderer også mere privatlivsrelaterede aspekter, som ofte bruges af interne revisorer.
Test på "eksakte matches" med identisk matchforhold (IMR)
Demonstration af, at forholdet mellem de syntetiske dataposter, der matcher en reel post fra de originale data, ikke er væsentligt større end det forhold, der kan forventes ved analyse af togdataene.
Test på "Lignende kampe" med Distance to Closest Record (DCR)
Demonstration af, at den normaliserede afstand for syntetiske dataposter til deres nærmeste faktiske post inden for de originale data ikke er væsentligt tættere end den afstand, der kan forventes ved analyse af togdataene.
Test på "Outliers" med Afstandsforhold for nærmeste nabo (NNDR)
Demonstration af, at afstandsforholdet mellem nærmeste og næstnærmeste syntetiske post til deres nærmeste post inden for de originale data ikke er væsentligt tættere end det forhold, der må forventes for togdataene.
Dette er kun et øjebliksbillede, der opsummerer essensen af vores kvalitetsudforskning og kvalitetssikringsrapport for syntetiske data. Det giver en nuanceret forståelse af distributioner, korrelationer og multivariate distributioner som en del af syntetiske data, som fanget af Syntho Engines avancerede muligheder. Flere detaljer om vores kvalitetssikringsrapport er tilgængelige på anmodning.