Anonymized data vs sịntetik data

Ọ bụrụ na ikpughe data gị aha tupu ịme nnwale data nke nyocha data, enwere ọtụtụ ihe na-egwu:

  1. N'ihe fọrọ nke nta ka ọ bụrụ n'ọnọdụ niile, data ezoro ezo ka nwere ike ịchọtaghachi azụ n'aka ndị mmadụ n'otu n'otu n'ihi ahịrị ndị akọwapụtara na nke pụrụ iche (dịka ndekọ ndekọ ahụike)
  2. Ka ị na-edobe aha ma ọ bụ chịkọta ọnụ, ka ị na-emebikwu data. Nke a na-ebelata ogo data gị ma si otú a ghọtakwuo gị
  3. Anonymization na-arụ ọrụ dị iche iche maka ụdị data dị iche iche. Nke a pụtara na ọ nweghị ike ịgbatị ma nwee ike na-ewe nnukwu oge

Data sịntetik na-edozi adịghị ike ndị a niile na ndị ọzọ. Lelee vidiyo dị n'okpuru ebe a ka ịhụ ọkachamara nyocha sitere na SAS (onye isi ahịa ahịa zuru ụwa ọnụ na nyocha) na-akọwa banyere ntule ya dị iche na àgwà dị n'etiti data mbụ, data a na-amaghị aha na nke Syntho mepụtara data synthetic.

Edere vidiyo a na Syntho x SAS D[N] Café gbasara data synthetic AI emepụtara. Chọta vidiyo zuru ezu ebe a.

Edwin van Unen zigara Syntho nke mbụ dataset ma anyị hazikọtara dataset. Mana ajụjụ a bụkwa: "Gịnị ga-eme ma ọ bụrụ na anyị atụnyere data sịntetik na data amaghị aha?" N'ihi na ị na-atụfu ọtụtụ ozi na data amaghị aha, nke a ọ ga-eme mgbe ị na-emepụta dataset? Anyị malitere site na dataset sitere na ụlọ ọrụ mgbasa ozi nwere ahịrị 56.000 na ogidi 128 nke ozi ụlọ ọrụ churn. Achịkọbara ihe ndekọ data a ma kpọchiekwa aha ya ka Edwin wee jiri synthetization tụnyere enweghị aha. Mgbe ahụ, Edwin malitere iji SAS Viya mee ihe ngosi. Ọ wuru ụdị churn di na nwunye na mbụ dataset, na-eji usoro mgbagha oge ochie na osisi mkpebi, kamakwa usoro ndị siri ike dị ka netwọkụ akwara ozi, nkwalite gradient, oke ọhịa - ụdị usoro a. Iji ọkọlọtọ SAS Viya nhọrọ mgbe ị na-ewu ụdị.

Mgbe ahụ, ọ bụ oge ileba anya na nsonaazụ ya. Nsonaazụ dị ezigbo mma maka data sịntetik ọ bụghị maka ịkọwapụta aha. Maka ndị ọkachamara na-amụ ihe na-enweghị igwe na-ege ntị, anyị na-ele anya na mpaghara n'okpuru ROC-curve nke na-agwa ihe banyere izi ezi nke ihe nlereanya ahụ. N'ịtụle data mbụ na data amaghị aha, anyị na-ahụ na ụdị data mbụ nwere mpaghara n'okpuru ROC-curve nke .8, nke mara mma nke ọma, Otú ọ dị, data a na-amaghị aha nwere mpaghara n'okpuru ROC-curve nke .6. Nke a pụtara na anyị na-atụfu ọtụtụ ozi site na ihe nlereanya a na-amaghị aha ka ị tụfuo ike ibu amụma.

Mana mgbe ahụ, ajụjụ a bụ kedu maka data synthetics? N'ebe a, anyị mere otu ihe ahụ mana kama ịkọwapụta data ahụ, Syntho mebere data ahụ. Ugbu a, anyị na-ahụ ma data mbụ na data synthetic nwere mpaghara n'okpuru ROC-curve nke .8, nke yiri ya. Ọ bụghị kpọmkwem otu n'ihi mgbanwe, ma yiri nnọọ. Nke a pụtara, ike nke data sịntetịt dị ezigbo mma - Edwin nwere obi ụtọ maka nke a.

otu ndị mmadụ na-amụmụ ọnụ ọchị

Data bụ sịntetik, mana otu anyị dị adị!

Kpọtụrụ Syntho na otu n'ime ndị ọkachamara anyị ga-akpọtụrụ gị na ọsọ ọkụ iji nyochaa uru nke data synthetic!