Стварайце сінтэтычныя даныя на аснове загадзя вызначаных правілаў і абмежаванняў, імкнучыся імітаваць даныя рэальнага свету або мадэляваць пэўныя сцэнарыі.
Сінтэтычныя даныя, створаныя на аснове правілаў, адносяцца да працэсу стварэння штучных або змадэляваных сінтэтычных даных, якія адпавядаюць загадзя вызначаным (бізнэс) правілам і абмежаванням. Гэты падыход прадугледжвае вызначэнне канкрэтных кіруючых прынцыпаў, умоў і адносін для стварэння сінтэтычных даных. Прычыны, па якіх арганізацыі выкарыстоўваюць сінтэтычныя даныя на аснове правілаў:
У тых выпадках, калі дадзеныя абмежаваныя, або калі вы не маеце даных наогул, патрэба ў рэпрэзентатыўных даных становіцца вырашальнай пры распрацоўцы новых функцый. Сінтэтычныя даныя на аснове правілаў дазваляюць ствараць даныя з нуля, забяспечваючы неабходныя тэставыя даныя для тэсціроўшчыкаў і распрацоўшчыкаў.
Сінтэтычныя даныя на аснове правілаў могуць узбагачаць даныя шляхам генерацыі пашыраных радкоў і/ці слупкоў. Яго можна выкарыстоўваць для стварэння дадатковых радкоў для лёгкага і эфектыўнага стварэння вялікіх набораў даных. Акрамя таго, сінтэтычныя даныя на аснове правілаў можна выкарыстоўваць для пашырэння даных і стварэння дадатковых новых слупкоў, якія патэнцыйна залежаць ад існуючых слупкоў.
Падыход, заснаваны на правілах, забяспечвае гібкасць і настройку для адаптацыі да розных фарматаў і структур даных, што дазваляе цалкам адаптаваць сінтэтычныя даныя ў адпаведнасці з канкрэтнымі патрэбамі. Можна распрацаваць правілы для мадэлявання розных сцэнарыяў, што робіць яго гнуткім метадам для стварэння даных.
Сінтэтычныя даныя на аснове правілаў палягчаюць ачыстку даных, ствараючы даныя ў адпаведнасці з загадзя вызначанымі правіламі, выпраўляючы неадпаведнасці, запаўняючы прапушчаныя значэнні і выдаляючы памылкі, забяспечваючы захаванне цэласнасці і якасці набору даных. Гэта дазваляе карыстальнікам мець даныя яшчэ больш высокай якасці.
Генерацыя сінтэтычных даных на аснове правілаў асабліва карысная ў сітуацыях, калі рэальныя персанальныя даныя нельга выкарыстоўваць з-за праблем прыватнасці або прававых абмежаванняў. Ствараючы сінтэтычныя даныя ў якасці альтэрнатывы, арганізацыі могуць тэставаць і распрацоўваць без шкоды для канфідэнцыйнай інфармацыі.
Наша платформа падтрымлівае генерацыю сінтэтычных даных на аснове правілаў праз нашу функцыю Calculated Column. Функцыі вылічанага слупка можна выкарыстоўваць для выканання шырокага спектру аперацый над дадзенымі і іншымі слупкамі, ад простых арыфметычных да складаных лагічных і статыстычных вылічэнняў. Калі вы акругляеце лічбы, здабываеце часткі дат, разлічваеце сярэднія значэнні або пераўтвараеце тэкст, гэтыя функцыі забяспечваюць універсальнасць для стварэння менавіта тых даных, якія вам патрэбны.
Вось некалькі тыповых прыкладаў генерацыі сінтэтычных даных на аснове правілаў з дапамогай нашых функцый вылічанага слупка: