Opret syntetiske data baseret på foruddefinerede regler og begrænsninger med det formål at efterligne data fra den virkelige verden eller simulere specifikke scenarier.
Regelbaserede genererede syntetiske data refererer til processen med at skabe kunstige eller simulerede syntetiske data, der følger foruddefinerede (forretnings)regler og begrænsninger. Denne tilgang involverer at definere specifikke retningslinjer, betingelser og relationer til at generere syntetiske data. Årsager til, at organisationer bruger regelbaserede syntetiske data:
I de tilfælde, hvor data enten er begrænset, eller hvor man slet ikke har data, bliver behovet for repræsentative data afgørende ved udvikling af nye funktionaliteter. Regelbaserede syntetiske data muliggør generering af data fra bunden, hvilket giver vigtige testdata til testere og udviklere.
Regelbaserede syntetiske data kunne berige data ved at generere udvidede rækker og/eller kolonner. Det kan bruges til at producere ekstra rækker for at skabe større datasæt nemt og effektivt. Derudover kan regelbaserede syntetiske data bruges til at udvide data og generere yderligere nye kolonner, potentielt afhængige af eksisterende kolonner.
Den regelbaserede tilgang giver fleksibilitet og tilpasning til at tilpasse sig forskellige dataformater og strukturer, hvilket muliggør fuld skræddersyet af syntetiske data efter specifikke behov. Man kan designe regler til at simulere forskellige scenarier, hvilket gør det til en fleksibel metode til at generere data.
Regelbaserede syntetiske data letter datarensning ved at generere data, der overholder foruddefinerede regler, korrigere uoverensstemmelser, udfylde manglende værdier og fjerne fejl, hvilket sikrer, at datasættets integritet og kvalitet bevares. Dette giver brugerne mulighed for at have data med endnu højere kvalitet.
Regelbaseret syntetisk datagenerering er især nyttig i scenarier, hvor rigtige personlige data ikke kan bruges på grund af privatlivsproblemer eller juridiske begrænsninger. Ved at skabe syntetiske data som alternativ kan organisationer teste og udvikle uden at gå på kompromis med følsomme oplysninger.
Vores platform understøtter generering af regelbaseret syntetiske data via vores Calculated Column-funktion. Beregnet kolonnefunktioner kan bruges til at udføre en lang række operationer på data og andre kolonner, fra simpel aritmetik til komplekse logiske og statistiske beregninger. Uanset om du afrunder tal, udtrækker dele af datoer, beregner gennemsnit eller transformerer tekst, giver disse funktioner alsidigheden til at skabe præcis de data, du har brug for.
Her er nogle typiske eksempler på generering af regelbaserede syntetiske data med vores beregnede kolonnefunktioner: