Gumawa ng synthetic na data batay sa mga paunang natukoy na panuntunan at mga hadlang, na naglalayong gayahin ang real-world na data o gayahin ang mga partikular na sitwasyon.
Ang nabuong synthetic na data na nakabatay sa panuntunan ay tumutukoy sa proseso ng paggawa ng artipisyal o simulate na sintetikong data na sumusunod sa mga paunang natukoy na (negosyo) na mga panuntunan at mga hadlang. Kasama sa diskarteng ito ang pagtukoy sa mga partikular na alituntunin, kundisyon, at mga ugnayan upang makabuo ng sintetikong data. Mga dahilan kung bakit gumagamit ang mga organisasyon ng Rule Based Synthetic Data:
Sa mga kaso kung saan ang data ay alinman sa limitado o kung saan wala ka talagang data, ang pangangailangan para sa kinatawan ng data ay nagiging mahalaga kapag bumubuo ng mga bagong functionality. Ang synthetic data na nakabatay sa panuntunan ay nagbibigay-daan sa pagbuo ng data mula sa simula, na nagbibigay ng mahahalagang data ng pagsubok para sa mga tester at developer.
Maaaring pagyamanin ng synthetic data na batay sa panuntunan ang data sa pamamagitan ng pagbuo ng mga pinahabang row at/o column. Maaari itong magamit upang makagawa ng mga karagdagang row upang makagawa ng mas malalaking dataset nang madali at mahusay. Bukod pa rito, maaaring gamitin ang synthetic na data na nakabatay sa panuntunan upang palawigin ang data at bumuo ng mga karagdagang bagong column na posibleng nakadepende sa mga kasalukuyang column.
Ang diskarteng nakabatay sa panuntunan ay nagbibigay ng kakayahang umangkop at pag-customize upang umangkop sa magkakaibang mga format at istruktura ng data, na nagbibigay-daan sa buong pagsasaayos ng sintetikong data ayon sa mga partikular na pangangailangan. Ang isa ay maaaring magdisenyo ng mga panuntunan upang gayahin ang iba't ibang mga sitwasyon, na ginagawa itong isang flexible na paraan para sa pagbuo ng data.
Pinapadali ng synthetic data na nakabatay sa panuntunan ang paglilinis ng data sa pamamagitan ng pagbuo ng data na sumusunod sa mga paunang natukoy na panuntunan, pagwawasto ng mga hindi pagkakapare-pareho, pagpupuno ng mga nawawalang value, at pag-aalis ng mga error, na tinitiyak na mapapanatili ang integridad at kalidad ng dataset. Nagbibigay-daan ito sa mga user na magkaroon ng data na may mas mataas na kalidad.
Ang pagbuo ng synthetic data na nakabatay sa panuntunan ay partikular na kapaki-pakinabang sa mga sitwasyon kung saan hindi magagamit ang totoong personal na data dahil sa mga alalahanin sa privacy o mga legal na paghihigpit. Sa pamamagitan ng paggawa ng sintetikong data bilang alternatibo, ang mga organisasyon ay maaaring sumubok at bumuo nang hindi kinokompromiso ang sensitibong impormasyon.
Sinusuportahan ng aming platform ang pagbuo ng Rule Based Synthetic Data sa pamamagitan ng aming function na Calculated Column. Maaaring gamitin ang mga function ng Calculated Column upang magsagawa ng malawak na hanay ng mga operasyon sa data at iba pang column, mula sa simpleng arithmetic hanggang sa kumplikadong logical at statistical computations. Kung ikaw ay nagbi-round ng mga numero, nag-e-extract ng mga bahagi ng mga petsa, nagkalkula ng mga average, o nag-transform ng text, ang mga function na ito ay nagbibigay ng versatility upang lumikha ng eksaktong data na kailangan mo.
Narito ang ilang karaniwang halimbawa upang makabuo ng Rule Based Synthetic Data gamit ang aming mga function ng Calculated Column: