Skep sintetiese data gebaseer op vooraf gedefinieerde reëls en beperkings, met die doel om werklike data na te boots of spesifieke scenario's te simuleer.
Reël-gebaseerde gegenereerde sintetiese data verwys na die proses om kunsmatige of gesimuleerde sintetiese data te skep wat voorafbepaalde (besigheids-) reëls en beperkings volg. Hierdie benadering behels die definisie van spesifieke riglyne, voorwaardes en verwantskappe om sintetiese data te genereer. Redes waarom organisasies reëlgebaseerde sintetiese data gebruik:
In gevalle waar data óf beperk is óf waar jy glad nie data het nie, word die behoefte aan verteenwoordigende data deurslaggewend wanneer nuwe funksionaliteite ontwikkel word. Reël-gebaseerde sintetiese data maak die generering van data van nuuts af moontlik, wat noodsaaklike toetsdata vir toetsers en ontwikkelaars verskaf.
Reëlgebaseerde sintetiese data kan data verryk deur uitgebreide rye en/of kolomme te genereer. Dit kan gebruik word om ekstra rye te produseer om groter datastelle maklik en doeltreffend te skep. Daarbenewens kan reëlgebaseerde sintetiese data gebruik word om data uit te brei en bykomende nuwe kolomme te genereer wat moontlik afhanklik is van bestaande kolomme.
Die reël-gebaseerde benadering bied buigsaamheid en aanpassing om aan te pas by diverse dataformate en strukture, wat die volledige pasmaak van sintetiese data volgens spesifieke behoeftes moontlik maak. Mens kan reëls ontwerp om verskeie scenario's te simuleer, wat dit 'n buigsame metode maak om data te genereer.
Reël-gebaseerde sintetiese data vergemaklik data-suiwering deur data te genereer wat aan voorafbepaalde reëls voldoen, inkonsekwenthede regstel, ontbrekende waardes invul en foute verwyder, om te verseker dat die integriteit en kwaliteit van die datastel behoue bly. Dit stel gebruikers in staat om data met selfs hoër gehalte te hê.
Reëlgebaseerde sintetiese datagenerering is veral nuttig in scenario's waar regte persoonlike data nie gebruik kan word nie as gevolg van privaatheidskwessies of wetlike beperkings. Deur sintetiese data as alternatief te skep, kan organisasies toets en ontwikkel sonder om sensitiewe inligting in die gedrang te bring.
Ons platform ondersteun die generering van reëlgebaseerde sintetiese data via ons Berekende Kolom-funksie. Berekende Kolom-funksies kan gebruik word om 'n wye reeks bewerkings op data en ander kolomme uit te voer, van eenvoudige rekenkundige tot komplekse logiese en statistiese berekeninge. Of jy nou getalle afrond, gedeeltes van datums onttrek, gemiddeldes bereken of teks transformeer, hierdie funksies bied die veelsydigheid om presies die data te skep wat jy nodig het.
Hier is 'n paar tipiese voorbeelde om reëlgebaseerde sintetiese data te genereer met ons berekende kolomfunksies: