Meitsje syntetyske gegevens basearre op foarôf definieare regels en beheiningen, mei as doel om realistyske gegevens te imitearjen of spesifike senario's te simulearjen.
Regel-basearre generearre syntetyske gegevens ferwiist nei it proses fan it meitsjen fan keunstmjittige as simulearre syntetyske gegevens dy't foarôf definieare (bedriuws) regels en beheiningen folgje. Dizze oanpak omfettet it definiearjen fan spesifike rjochtlinen, betingsten en relaasjes om syntetyske gegevens te generearjen. Redenen wêrom't organisaasjes Rule Based Synthetic Data brûke:
Yn gefallen dêr't gegevens of beheind binne of wêr't jo hielendal gjin gegevens hawwe, wurdt de needsaak foar represintative gegevens krúsjaal by it ûntwikkeljen fan nije funksjonaliteiten. Regel-basearre syntetyske gegevens makket it generearjen fan gegevens fanôf it begjin mooglik, it leverjen fan essensjele testgegevens foar testers en ûntwikkelders.
Regel basearre syntetyske gegevens kinne gegevens ferrykje troch it generearjen fan útwreide rigen en/of kolommen. It kin brûkt wurde om ekstra rigen te produsearjen om gruttere datasets maklik en effisjint te meitsjen. Derneist kinne op regel basearre syntetyske gegevens brûkt wurde om gegevens út te wreidzjen en ekstra nije kolommen te generearjen dy't mooglik ôfhinklik binne fan besteande kolommen.
De op regels basearre oanpak biedt fleksibiliteit en oanpassing om oan te passen oan ferskate gegevensformaten en struktueren, wêrtroch it folsleine maatwurk fan syntetyske gegevens mooglik makket neffens spesifike behoeften. Men kin regels ûntwerpe om ferskate senario's te simulearjen, wêrtroch it in fleksibele metoade is foar it generearjen fan gegevens.
Regel-basearre syntetyske gegevens fasilitearje it skjinmeitsjen fan gegevens troch it generearjen fan gegevens dy't oan foarôf definieare regels folgje, ynkonsistinsjes korrigearje, ûntbrekkende wearden ynfolje en flaters ferwiderje, garandearje dat de yntegriteit en kwaliteit fan 'e dataset wurdt behâlden. Hjirmei kinne brûkers gegevens hawwe mei noch hegere kwaliteit.
Regel-basearre syntetyske gegevensgeneraasje is benammen nuttich yn senario's wêr't echte persoanlike gegevens net kinne wurde brûkt fanwege privacysoarch of juridyske beheiningen. Troch syntetyske gegevens as alternatyf te meitsjen, kinne organisaasjes testen en ûntwikkelje sûnder gefoelige ynformaasje te kompromittearjen.
Us platfoarm stipet foar generaasje fan regelbasearre syntetyske gegevens fia ús funksje Berekkene kolom. Berekkene kolomfunksjes kinne brûkt wurde om in breed oanbod fan operaasjes út te fieren op gegevens en oare kolommen, fan ienfâldige arithmetyk oant komplekse logyske en statistyske berekkeningen. Oft jo nûmers ôfrûnje, dielen fan datums ekstrahearje, gemiddelden berekkenje of tekst transformearje, dizze funksjes jouwe de veelzijdigheid om krekt de gegevens te meitsjen dy't jo nedich binne.
Hjir binne wat typyske foarbylden om regelbasearre syntetyske gegevens te generearjen mei ús berekkene kolomfunksjes: