Skapa syntetisk data baserat på fördefinierade regler och begränsningar, i syfte att efterlikna verkliga data eller simulera specifika scenarier.
Regelbaserad genererad syntetisk data hänvisar till processen att skapa artificiell eller simulerad syntetisk data som följer fördefinierade (affärs-) regler och begränsningar. Detta tillvägagångssätt innebär att definiera specifika riktlinjer, villkor och relationer för att generera syntetisk data. Anledningar till varför organisationer använder regelbaserad syntetisk data:
I de fall data antingen är begränsad eller där man inte har data alls blir behovet av representativ data avgörande vid utveckling av nya funktioner. Regelbaserad syntetisk data möjliggör generering av data från grunden, vilket ger viktiga testdata för testare och utvecklare.
Regelbaserad syntetisk data kan berika data genom att generera utökade rader och/eller kolumner. Den kan användas för att skapa extra rader för att skapa större datauppsättningar enkelt och effektivt. Dessutom kan regelbaserad syntetisk data användas för att utöka data och generera ytterligare nya kolumner som potentiellt är beroende av befintliga kolumner.
Det regelbaserade tillvägagångssättet ger flexibilitet och anpassning för att anpassa sig till olika dataformat och strukturer, vilket möjliggör fullständig anpassning av syntetiska data efter specifika behov. Man kan utforma regler för att simulera olika scenarier, vilket gör det till en flexibel metod för att generera data.
Regelbaserad syntetisk data underlättar datarensning genom att generera data som följer fördefinierade regler, korrigera inkonsekvenser, fylla i saknade värden och ta bort fel, vilket säkerställer att datauppsättningens integritet och kvalitet bevaras. Detta gör att användarna kan ha data med ännu högre kvalitet.
Regelbaserad syntetisk datagenerering är särskilt användbar i scenarier där riktiga personuppgifter inte kan användas på grund av integritetsproblem eller juridiska begränsningar. Genom att skapa syntetisk data som alternativ kan organisationer testa och utveckla utan att kompromissa med känslig information.
Vår plattform stöder generering av regelbaserad syntetisk data via vår funktion för beräknad kolumn. Beräknade kolumnfunktioner kan användas för att utföra ett brett spektrum av operationer på data och andra kolumner, från enkel aritmetik till komplexa logiska och statistiska beräkningar. Oavsett om du avrundar siffror, extraherar delar av datum, beräknar medelvärden eller transformerar text, ger dessa funktioner mångsidigheten att skapa exakt den data du behöver.
Här är några typiska exempel för att generera regelbaserad syntetisk data med våra beräknade kolumnfunktioner: