AI- സൃഷ്ടിച്ച സിന്തറ്റിക് ഡാറ്റ, ഉയർന്ന നിലവാരമുള്ള ഡാറ്റയിലേക്കുള്ള എളുപ്പവും വേഗത്തിലുള്ള ആക്‌സസ്സും?

AI പ്രായോഗികമായി സിന്തറ്റിക് ഡാറ്റ സൃഷ്ടിച്ചു

AI- ജനറേറ്റഡ് സിന്തറ്റിക് ഡാറ്റയിൽ വിദഗ്ധനായ സിന്തോ, തിരിയാൻ ലക്ഷ്യമിടുന്നു privacy by design AI- സൃഷ്ടിച്ച സിന്തറ്റിക് ഡാറ്റ ഉപയോഗിച്ച് ഒരു മത്സര നേട്ടത്തിലേക്ക്. ഉയർന്ന നിലവാരമുള്ള ഡാറ്റയിലേക്ക് എളുപ്പത്തിലും വേഗത്തിലും ആക്‌സസ് ചെയ്യുന്ന ശക്തമായ ഡാറ്റ ഫൗണ്ടേഷൻ നിർമ്മിക്കാൻ അവർ ഓർഗനൈസേഷനുകളെ സഹായിക്കുന്നു കൂടാതെ അടുത്തിടെ ഫിലിപ്‌സ് ഇന്നൊവേഷൻ അവാർഡ് നേടി.

എന്നിരുന്നാലും, പതിവായി ചോദിക്കുന്ന ചോദ്യങ്ങൾ അവതരിപ്പിക്കുന്ന താരതമ്യേന പുതിയൊരു പരിഹാരമാണ് AI ഉപയോഗിച്ചുള്ള സിന്തറ്റിക് ഡാറ്റ ജനറേഷൻ. ഇവയ്‌ക്ക് ഉത്തരം നൽകാൻ, അഡ്വാൻസ്‌ഡ് അനലിറ്റിക്‌സിലെയും AI സോഫ്‌റ്റ്‌വെയറിലെയും മാർക്കറ്റ് ലീഡറായ എസ്‌എഎസുമായി ചേർന്ന് സിന്തോ ഒരു കേസ്-സ്റ്റഡി ആരംഭിച്ചു.

Dutch AI Coalition (NL AIC) യുമായി സഹകരിച്ച്, ഡാറ്റയുടെ ഗുണനിലവാരം, നിയമപരമായ സാധുത, ഉപയോഗക്ഷമത എന്നിവയെക്കുറിച്ചുള്ള വിവിധ വിലയിരുത്തലുകൾ വഴി സിന്തോ എഞ്ചിൻ സൃഷ്ടിച്ച AI- ജനറേറ്റഡ് സിന്തറ്റിക് ഡാറ്റയെ യഥാർത്ഥ ഡാറ്റയുമായി താരതമ്യം ചെയ്തുകൊണ്ട് സിന്തറ്റിക് ഡാറ്റയുടെ മൂല്യം അവർ അന്വേഷിച്ചു.

ഡാറ്റ അജ്ഞാതമാക്കൽ ഒരു പരിഹാരമല്ലേ?

ക്ലാസിക് അജ്ഞാതവൽക്കരണ ടെക്നിക്കുകൾക്ക് പൊതുവായി ഉള്ളത്, വ്യക്തികളെ കണ്ടെത്തുന്നതിന് തടസ്സം സൃഷ്ടിക്കുന്നതിനായി യഥാർത്ഥ ഡാറ്റ കൈകാര്യം ചെയ്യുന്നു. സാമാന്യവൽക്കരണം, അടിച്ചമർത്തൽ, തുടയ്ക്കൽ, വ്യാജനാമകരണം, ഡാറ്റാ മാസ്കിംഗ്, വരികളുടെയും നിരകളുടെയും ഇടകലർത്തൽ എന്നിവയാണ് ഉദാഹരണങ്ങൾ. ചുവടെയുള്ള പട്ടികയിൽ നിങ്ങൾക്ക് ഉദാഹരണങ്ങൾ കണ്ടെത്താം.

ഡാറ്റ അജ്ഞാതമാക്കൽ

ആ വിദ്യകൾ 3 പ്രധാന വെല്ലുവിളികൾ അവതരിപ്പിക്കുന്നു:

  1. അവ ഓരോ ഡാറ്റാ തരത്തിനും ഓരോ ഡാറ്റാസെറ്റിനും വ്യത്യസ്‌തമായി പ്രവർത്തിക്കുന്നു, ഇത് സ്കെയിൽ ചെയ്യാൻ പ്രയാസകരമാക്കുന്നു. കൂടാതെ, അവ വ്യത്യസ്തമായി പ്രവർത്തിക്കുന്നതിനാൽ, ഏത് രീതികൾ പ്രയോഗിക്കണം, ഏത് സാങ്കേതികതകളുടെ സംയോജനം ആവശ്യമാണ് എന്നതിനെക്കുറിച്ച് എപ്പോഴും ചർച്ചകൾ ഉണ്ടാകും.
  2. ഒറിജിനൽ ഡാറ്റയുമായി എല്ലായ്‌പ്പോഴും പരസ്പരം ബന്ധമുണ്ട്. എല്ലായ്‌പ്പോഴും ഒരു സ്വകാര്യത അപകടസാധ്യതയുണ്ടാകുമെന്നാണ് ഇതിനർത്ഥം, പ്രത്യേകിച്ച് എല്ലാ ഓപ്പൺ ഡാറ്റാസെറ്റുകളും ആ ഡാറ്റാസെറ്റുകൾ ലിങ്ക് ചെയ്യുന്നതിനുള്ള ലഭ്യമായ സാങ്കേതികതകളും കാരണം.
  3. അവർ ഡാറ്റ കൈകാര്യം ചെയ്യുകയും അതുവഴി ഡാറ്റ നശിപ്പിക്കുകയും ചെയ്യുന്നു. "പ്രവചന ശക്തി" അനിവാര്യമായ AI ടാസ്‌ക്കുകൾക്ക് ഇത് പ്രത്യേകിച്ചും വിനാശകരമാണ്, കാരണം മോശം നിലവാരമുള്ള ഡാറ്റ AI മോഡലിൽ നിന്ന് മോശം സ്ഥിതിവിവരക്കണക്കുകൾക്ക് കാരണമാകും (ഗാർബേജ്-ഇൻ മാലിന്യം പുറന്തള്ളുന്നതിന് കാരണമാകും).

ഈ പോയിന്റുകളും ഈ കേസ് പഠനത്തിലൂടെ വിലയിരുത്തപ്പെടുന്നു.

കേസ് പഠനത്തിന് ഒരു ആമുഖം

കേസ് പഠനത്തിനായി, 56.600 ഉപഭോക്താക്കളുടെ ഡാറ്റ അടങ്ങുന്ന എസ്എഎസ് നൽകിയ ടെലികോം ഡാറ്റാസെറ്റാണ് ടാർഗെറ്റ് ഡാറ്റാസെറ്റ്. ഒരു ഉപഭോക്താവ് കമ്പനി വിട്ടിട്ടുണ്ടോ (അതായത് 'ചുരുങ്ങി') അല്ലെങ്കിൽ ഇല്ലെന്ന് സൂചിപ്പിക്കുന്ന ഒരു കോളം ഉൾപ്പെടെ 128 കോളങ്ങൾ ഡാറ്റാസെറ്റിൽ അടങ്ങിയിരിക്കുന്നു. ഉപഭോക്തൃ ചതി പ്രവചിക്കുന്നതിനും പരിശീലനം ലഭിച്ച മോഡലുകളുടെ പ്രകടനം വിലയിരുത്തുന്നതിനും ചില മോഡലുകളെ പരിശീലിപ്പിക്കുന്നതിന് സിന്തറ്റിക് ഡാറ്റ ഉപയോഗിക്കുക എന്നതായിരുന്നു കേസ് പഠനത്തിന്റെ ലക്ഷ്യം. ചർൺ പ്രവചനം ഒരു വർഗ്ഗീകരണ ടാസ്‌ക് ആയതിനാൽ, പ്രവചനങ്ങൾ നടത്താൻ SAS നാല് ജനപ്രിയ വർഗ്ഗീകരണ മോഡലുകൾ തിരഞ്ഞെടുത്തു:

  1. ക്രമരഹിതമായ വനം
  2. ഗ്രേഡിയന്റ് ബൂസ്റ്റിംഗ്
  3. ലോജിസ്റ്റിക് റിഗ്രഷൻ
  4. ന്യൂറൽ നെറ്റ്വർക്ക്

സിന്തറ്റിക് ഡാറ്റ സൃഷ്ടിക്കുന്നതിന് മുമ്പ്, എസ്എഎസ് ടെലികോം ഡാറ്റാസെറ്റിനെ ക്രമരഹിതമായി ഒരു ട്രെയിൻ സെറ്റിലേക്കും (മോഡലുകൾ പരിശീലിപ്പിക്കുന്നതിന്) ഒരു ഹോൾഡൗട്ട് സെറ്റിലേക്കും (മോഡലുകൾ സ്കോർ ചെയ്യുന്നതിനായി) വിഭജിക്കുന്നു. സ്‌കോറിങ്ങിനായി പ്രത്യേക ഹോൾഡൗട്ട് സെറ്റ് ഉള്ളത്, പുതിയ ഡാറ്റയിൽ പ്രയോഗിക്കുമ്പോൾ വർഗ്ഗീകരണ മോഡൽ എത്രത്തോളം നന്നായി പ്രവർത്തിക്കുമെന്ന് നിഷ്പക്ഷമായി വിലയിരുത്താൻ അനുവദിക്കുന്നു.

ട്രെയിൻ സെറ്റ് ഇൻപുട്ടായി ഉപയോഗിച്ച്, ഒരു സിന്തറ്റിക് ഡാറ്റാസെറ്റ് സൃഷ്ടിക്കാൻ സിന്തോ അതിന്റെ സിന്തോ എഞ്ചിൻ ഉപയോഗിച്ചു. ബെഞ്ച്‌മാർക്കിംഗിനായി, ഒരു നിശ്ചിത പരിധിയിൽ (കെ-അനോണിമിറ്റിയുടെ) എത്താൻ വിവിധ അജ്ഞാതവൽക്കരണ സാങ്കേതിക വിദ്യകൾ പ്രയോഗിച്ചതിന് ശേഷം ട്രെയിൻ സെറ്റിന്റെ കൃത്രിമ പതിപ്പും SAS സൃഷ്ടിച്ചു. മുൻ ഘട്ടങ്ങൾ നാല് ഡാറ്റാസെറ്റുകളായി മാറി:

  1. ഒരു ട്രെയിൻ ഡാറ്റാസെറ്റ് (അതായത് യഥാർത്ഥ ഡാറ്റാസെറ്റ് മൈനസ് ഹോൾഡൗട്ട് ഡാറ്റാസെറ്റ്)
  2. ഒരു ഹോൾഡൗട്ട് ഡാറ്റാസെറ്റ് (അതായത് യഥാർത്ഥ ഡാറ്റാസെറ്റിന്റെ ഒരു ഉപഗണം)
  3. ഒരു അജ്ഞാത ഡാറ്റാഗണം (ട്രെയിൻ ഡാറ്റാസെറ്റിനെ അടിസ്ഥാനമാക്കി)
  4. ഒരു സിന്തറ്റിക് ഡാറ്റാസെറ്റ് (ട്രെയിൻ ഡാറ്റാസെറ്റിനെ അടിസ്ഥാനമാക്കി)

ഡാറ്റാസെറ്റുകൾ 1, 3, 4 എന്നിവ ഓരോ ക്ലാസിഫിക്കേഷൻ മോഡലും പരിശീലിപ്പിക്കാൻ ഉപയോഗിച്ചു, അതിന്റെ ഫലമായി 12 (3 x 4) പരിശീലനം ലഭിച്ച മോഡലുകൾ. SAS പിന്നീട് ഓരോ മോഡലും ഉപഭോക്തൃ ചതി പ്രവചിക്കുന്ന കൃത്യത അളക്കാൻ ഹോൾഡൗട്ട് ഡാറ്റാസെറ്റ് ഉപയോഗിച്ചു. ചില അടിസ്ഥാന സ്ഥിതിവിവരക്കണക്കുകളിൽ തുടങ്ങി ഫലങ്ങൾ ചുവടെ അവതരിപ്പിച്ചിരിക്കുന്നു.

SAS-ൽ സൃഷ്ടിച്ച മെഷീൻ ലേണിംഗ് പൈപ്പ്ലൈൻ

ചിത്രം: SAS വിഷ്വൽ ഡാറ്റ മൈനിംഗിലും മെഷീൻ ലേണിംഗിലും സൃഷ്ടിച്ച മെഷീൻ ലേണിംഗ് പൈപ്പ്ലൈൻ

അജ്ഞാത ഡാറ്റയെ യഥാർത്ഥ ഡാറ്റയുമായി താരതമ്യം ചെയ്യുമ്പോൾ അടിസ്ഥാന സ്ഥിതിവിവരക്കണക്കുകൾ

അജ്ഞാതവൽക്കരണ വിദ്യകൾ അടിസ്ഥാന പാറ്റേണുകൾ, ബിസിനസ്സ് ലോജിക്, ബന്ധങ്ങൾ, സ്ഥിതിവിവരക്കണക്കുകൾ എന്നിവപോലും നശിപ്പിക്കുന്നു (ചുവടെയുള്ള ഉദാഹരണത്തിലെന്നപോലെ). അടിസ്ഥാന വിശകലനത്തിനായി അജ്ഞാത ഡാറ്റ ഉപയോഗിക്കുന്നത് വിശ്വസനീയമല്ലാത്ത ഫലങ്ങൾ നൽകുന്നു. വാസ്തവത്തിൽ, അജ്ഞാതമാക്കിയ ഡാറ്റയുടെ മോശം ഗുണനിലവാരം, വിപുലമായ അനലിറ്റിക്‌സ് ടാസ്‌ക്കുകൾക്ക് (ഉദാ. AI/ML മോഡലിംഗും ഡാഷ്‌ബോർഡിംഗും) ഉപയോഗിക്കുന്നത് മിക്കവാറും അസാധ്യമാക്കി.

അജ്ഞാത ഡാറ്റയെ യഥാർത്ഥ ഡാറ്റയുമായി താരതമ്യം ചെയ്യുന്നു

യഥാർത്ഥ ഡാറ്റയുമായി സിന്തറ്റിക് ഡാറ്റ താരതമ്യം ചെയ്യുമ്പോൾ അടിസ്ഥാന സ്ഥിതിവിവരക്കണക്കുകൾ

AI ഉപയോഗിച്ചുള്ള സിന്തറ്റിക് ഡാറ്റ ജനറേഷൻ അടിസ്ഥാന പാറ്റേണുകൾ, ബിസിനസ്സ് ലോജിക്, ബന്ധങ്ങൾ, സ്ഥിതിവിവരക്കണക്കുകൾ എന്നിവ സംരക്ഷിക്കുന്നു (ചുവടെയുള്ള ഉദാഹരണം പോലെ). അടിസ്ഥാന വിശകലനത്തിനായി സിന്തറ്റിക് ഡാറ്റ ഉപയോഗിക്കുന്നത് അങ്ങനെ വിശ്വസനീയമായ ഫലങ്ങൾ നൽകുന്നു. പ്രധാന ചോദ്യം, വിപുലമായ അനലിറ്റിക്‌സ് ടാസ്‌ക്കുകൾക്ക് (ഉദാ. AI/ML മോഡലിംഗും ഡാഷ്‌ബോർഡിംഗും) സിന്തറ്റിക് ഡാറ്റ ഹോൾഡ് ചെയ്യുമോ?

സിന്തറ്റിക് ഡാറ്റയെ യഥാർത്ഥ ഡാറ്റയുമായി താരതമ്യം ചെയ്യുന്നു

AI- ജനറേറ്റഡ് സിന്തറ്റിക് ഡാറ്റയും വിപുലമായ അനലിറ്റിക്‌സും

സിന്തറ്റിക് ഡാറ്റ അടിസ്ഥാന പാറ്റേണുകൾക്ക് മാത്രമല്ല (മുൻ പ്ലോട്ടുകളിൽ കാണിച്ചിരിക്കുന്നതുപോലെ), വിപുലമായ അനലിറ്റിക്‌സ് ടാസ്‌ക്കുകൾക്ക് ആവശ്യമായ ആഴത്തിലുള്ള 'മറഞ്ഞിരിക്കുന്ന' സ്റ്റാറ്റിസ്റ്റിക്കൽ പാറ്റേണുകളും ഇത് ക്യാപ്‌ചർ ചെയ്യുന്നു. രണ്ടാമത്തേത് ചുവടെയുള്ള ബാർ ചാർട്ടിൽ പ്രദർശിപ്പിച്ചിരിക്കുന്നു, സിന്തറ്റിക് ഡാറ്റയിൽ പരിശീലിപ്പിച്ച മോഡലുകളുടെ കൃത്യതയും യഥാർത്ഥ ഡാറ്റയിൽ പരിശീലനം ലഭിച്ച മോഡലുകളും സമാനമാണെന്ന് സൂചിപ്പിക്കുന്നു. കൂടാതെ, കർവിന് (AUC*) കീഴിലുള്ള ഒരു ഏരിയ 0.5 ന് അടുത്താണ്, അജ്ഞാത ഡാറ്റയിൽ പരിശീലനം ലഭിച്ച മോഡലുകൾ ഏറ്റവും മോശം പ്രകടനം കാഴ്ചവെക്കുന്നു. ഒറിജിനൽ ഡാറ്റയുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ സിന്തറ്റിക് ഡാറ്റയെക്കുറിച്ചുള്ള എല്ലാ വിപുലമായ അനലിറ്റിക്‌സ് വിലയിരുത്തലുകളുമുള്ള പൂർണ്ണ റിപ്പോർട്ട് അഭ്യർത്ഥന പ്രകാരം ലഭ്യമാണ്.

*AUC: യഥാർത്ഥ പോസിറ്റീവ്, തെറ്റായ പോസിറ്റീവ്, തെറ്റായ നെഗറ്റീവ്, യഥാർത്ഥ നെഗറ്റീവുകൾ എന്നിവ കണക്കിലെടുത്ത് വിപുലമായ അനലിറ്റിക്‌സ് മോഡലുകളുടെ കൃത്യതയ്ക്കുള്ള ഒരു അളവുകോലാണ് വക്രത്തിന് കീഴിലുള്ള ഏരിയ. 0,5 എന്നാൽ ഒരു മോഡലുകൾ ക്രമരഹിതമായി പ്രവചിക്കുന്നുവെന്നും പ്രവചന ശക്തി ഇല്ലെന്നും 1 അർത്ഥമാക്കുന്നത് മോഡൽ എല്ലായ്പ്പോഴും ശരിയാണെന്നും പൂർണ്ണമായ പ്രവചന ശക്തിയുണ്ടെന്നുമാണ്.

കൂടാതെ, മോഡലുകളുടെ യഥാർത്ഥ പരിശീലനത്തിന് ആവശ്യമായ ഡാറ്റ സവിശേഷതകളും പ്രധാന വേരിയബിളുകളും മനസിലാക്കാൻ ഈ സിന്തറ്റിക് ഡാറ്റ ഉപയോഗിക്കാം. യഥാർത്ഥ ഡാറ്റയുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ സിന്തറ്റിക് ഡാറ്റയിൽ അൽഗോരിതങ്ങൾ തിരഞ്ഞെടുത്ത ഇൻപുട്ടുകൾ വളരെ സാമ്യമുള്ളതാണ്. അതിനാൽ, ഈ സിന്തറ്റിക് പതിപ്പിൽ മോഡലിംഗ് പ്രക്രിയ നടത്താം, ഇത് ഡാറ്റാ ലംഘനങ്ങളുടെ സാധ്യത കുറയ്ക്കുന്നു. എന്നിരുന്നാലും, വ്യക്തിഗത രേഖകൾ അനുമാനിക്കുമ്പോൾ (ഉദാ. ടെൽകോ ഉപഭോക്താവ്) യഥാർത്ഥ ഡാറ്റയിൽ വീണ്ടും പരിശീലനം നൽകുന്നത് വിശദീകരണത്തിനോ സ്വീകാര്യത വർദ്ധിപ്പിക്കുന്നതിനോ അല്ലെങ്കിൽ നിയന്ത്രണം കാരണമായോ ശുപാർശ ചെയ്യുന്നു.                              

അൽഗോരിതം പ്രകാരം AUC രീതി പ്രകാരം ഗ്രൂപ്പുചെയ്‌തു

എ.യു.സി.

നിഗമനങ്ങൾ:

  • ഒറിജിനൽ ഡാറ്റയിൽ പരിശീലിപ്പിച്ച മോഡലുകളുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ സിന്തറ്റിക് ഡാറ്റയിൽ പരിശീലനം ലഭിച്ച മോഡലുകൾ വളരെ സമാനമായ പ്രകടനം കാണിക്കുന്നു
  • യഥാർത്ഥ ഡാറ്റയിലോ സിന്തറ്റിക് ഡാറ്റയിലോ പരിശീലിപ്പിച്ച മോഡലുകളെ അപേക്ഷിച്ച് 'ക്ലാസിക് അനോണിമൈസേഷൻ ടെക്നിക്കുകൾ' ഉപയോഗിച്ച് അജ്ഞാത ഡാറ്റയിൽ പരിശീലനം ലഭിച്ച മോഡലുകൾ താഴ്ന്ന പ്രകടനമാണ് കാണിക്കുന്നത്.
  • സിന്തറ്റിക് ഡാറ്റ ജനറേഷൻ എളുപ്പവും വേഗമേറിയതുമാണ്, കാരണം ഓരോ ഡാറ്റാസെറ്റിനും ഓരോ ഡാറ്റാ തരത്തിനും സാങ്കേതികത ഒരേപോലെ പ്രവർത്തിക്കുന്നു.

മൂല്യവർദ്ധന സിന്തറ്റിക് ഡാറ്റ ഉപയോഗ കേസുകൾ

കേസ് 1 ഉപയോഗിക്കുക: മോഡൽ വികസനത്തിനും വിപുലമായ അനലിറ്റിക്‌സിനും സിന്തറ്റിക് ഡാറ്റ

മോഡലുകൾ വികസിപ്പിക്കുന്നതിന് (ഉദാ. ഡാഷ്‌ബോർഡുകൾ [BI], അഡ്വാൻസ്ഡ് അനലിറ്റിക്‌സ് [AI & ML]) ഉപയോഗിക്കാവുന്നതും ഉയർന്ന നിലവാരമുള്ളതുമായ ഡാറ്റയിലേക്ക് എളുപ്പവും വേഗത്തിലുള്ളതുമായ ആക്‌സസ് ഉള്ള ശക്തമായ ഡാറ്റ ഫൗണ്ടേഷൻ ഉണ്ടായിരിക്കേണ്ടത് അത്യാവശ്യമാണ്. എന്നിരുന്നാലും, പല ഓർഗനൈസേഷനുകളും 3 പ്രധാന വെല്ലുവിളികൾക്ക് കാരണമാകുന്ന ഒരു ഉപോൽപ്പന്ന ഡാറ്റ അടിത്തറയിൽ നിന്ന് കഷ്ടപ്പെടുന്നു:

  • (സ്വകാര്യത) നിയന്ത്രണങ്ങൾ, ആന്തരിക പ്രക്രിയകൾ അല്ലെങ്കിൽ ഡാറ്റ സൈലോകൾ എന്നിവ കാരണം ഡാറ്റയിലേക്ക് ആക്സസ് ലഭിക്കുന്നതിന് കാലങ്ങൾ എടുക്കും
  • ക്ലാസിക് അനോണിമൈസേഷൻ ടെക്നിക്കുകൾ ഡാറ്റയെ നശിപ്പിക്കുന്നു, വിശകലനത്തിനും വിപുലമായ വിശകലനത്തിനും ഡാറ്റയെ ഇനി അനുയോജ്യമല്ലാത്തതാക്കുന്നു (മാലിന്യം ഇൻ = ഗാർബേജ് ഔട്ട്)
  • ഓരോ ഡാറ്റാസെറ്റിനും ഓരോ ഡാറ്റാ തരത്തിനും വ്യത്യസ്തമായി പ്രവർത്തിക്കുന്നതിനാലും വലിയ മൾട്ടി-ടേബിൾ ഡാറ്റാബേസുകൾ കൈകാര്യം ചെയ്യാൻ കഴിയാത്തതിനാലും നിലവിലുള്ള പരിഹാരങ്ങൾ സ്കെയിലബിൾ അല്ല

സിന്തറ്റിക് ഡാറ്റ സമീപനം: യഥാർത്ഥ സിന്തറ്റിക് ഡാറ്റ ഉപയോഗിച്ച് മോഡലുകൾ വികസിപ്പിക്കുക:

  • നിങ്ങളുടെ ഡവലപ്പർമാരെ തടസ്സപ്പെടുത്താതെ യഥാർത്ഥ ഡാറ്റയുടെ ഉപയോഗം കുറയ്ക്കുക
  • വ്യക്തിഗത ഡാറ്റ അൺലോക്കുചെയ്‌ത് മുമ്പ് നിയന്ത്രിച്ചിരുന്ന കൂടുതൽ ഡാറ്റയിലേക്ക് ആക്‌സസ് നേടുക (ഉദാ: സ്വകാര്യത കാരണം)
  • പ്രസക്തമായ ഡാറ്റയിലേക്ക് എളുപ്പവും വേഗത്തിലുള്ളതുമായ ഡാറ്റ ആക്സസ്
  • ഓരോ ഡാറ്റാസെറ്റിനും ഡാറ്റാടൈപ്പിനും വൻതോതിലുള്ള ഡാറ്റാബേസുകൾക്കും ഒരേപോലെ പ്രവർത്തിക്കുന്ന സ്കേലബിൾ സൊല്യൂഷൻ

ഡാറ്റ അൺലോക്ക് ചെയ്യുന്നതിനും ഡാറ്റാ അവസരങ്ങൾ പ്രയോജനപ്പെടുത്തുന്നതിനും ഉപയോഗിക്കാവുന്നതും ഉയർന്ന നിലവാരമുള്ളതുമായ ഡാറ്റയിലേക്ക് എളുപ്പത്തിലും വേഗത്തിലും ആക്‌സസ്സുള്ള ശക്തമായ ഡാറ്റ ഫൗണ്ടേഷൻ നിർമ്മിക്കാൻ ഇത് ഓർഗനൈസേഷനെ അനുവദിക്കുന്നു.

 

കേസ് 2 ഉപയോഗിക്കുക: സോഫ്റ്റ്‌വെയർ പരിശോധനയ്ക്കും വികസനത്തിനും ഡെലിവറിക്കുമായി സ്മാർട്ട് സിന്തറ്റിക് ടെസ്റ്റ് ഡാറ്റ

അത്യാധുനിക സോഫ്‌റ്റ്‌വെയർ സൊല്യൂഷനുകൾ നൽകുന്നതിന് ഉയർന്ന നിലവാരമുള്ള ടെസ്റ്റ് ഡാറ്റ ഉപയോഗിച്ച് പരിശോധനയും വികസനവും അത്യാവശ്യമാണ്. യഥാർത്ഥ പ്രൊഡക്ഷൻ ഡാറ്റ ഉപയോഗിക്കുന്നത് വ്യക്തമാണെന്ന് തോന്നുന്നു, എന്നാൽ (സ്വകാര്യത) നിയന്ത്രണങ്ങൾ കാരണം ഇത് അനുവദനീയമല്ല. ബദൽ Test Data Management (TDM) ടൂളുകൾ അവതരിപ്പിക്കുന്നു "legacy-by-design"ടെസ്റ്റ് ഡാറ്റ ശരിയാക്കുന്നതിൽ:

  • പ്രൊഡക്ഷൻ ഡാറ്റ പ്രതിഫലിപ്പിക്കരുത്, ബിസിനസ് ലോജിക്കും റഫറൻഷ്യൽ സമഗ്രതയും സംരക്ഷിക്കപ്പെടുന്നില്ല
  • ജോലി സാവധാനവും സമയമെടുക്കും
  • മാനുവൽ ജോലി ആവശ്യമാണ്

സിന്തറ്റിക് ഡാറ്റാ സമീപനം: AI- ജനറേറ്റഡ് സിന്തറ്റിക് ടെസ്റ്റ് ഡാറ്റ ഉപയോഗിച്ച് പരീക്ഷിച്ച് വികസിപ്പിക്കുക:

  • സംരക്ഷിത ബിസിനസ്സ് ലോജിക്കും റഫറൻഷ്യൽ സമഗ്രതയും ഉള്ള പ്രൊഡക്ഷൻ പോലുള്ള ഡാറ്റ
  • അത്യാധുനിക AI ഉപയോഗിച്ച് എളുപ്പവും വേഗത്തിലുള്ളതുമായ ഡാറ്റ ജനറേഷൻ
  • രൂപകൽപ്പന പ്രകാരം സ്വകാര്യത
  • എളുപ്പവും വേഗതയേറിയതും agile

അത്യാധുനിക സോഫ്‌റ്റ്‌വെയർ സൊല്യൂഷനുകൾ നൽകുന്നതിന് അടുത്ത ലെവൽ ടെസ്റ്റ് ഡാറ്റ ഉപയോഗിച്ച് ടെസ്റ്റ് ചെയ്യാനും വികസിപ്പിക്കാനും ഇത് ഓർഗനൈസേഷനെ അനുവദിക്കുന്നു!

കൂടുതൽ വിവരങ്ങൾ

താൽപ്പര്യമുണ്ടോ? സിന്തറ്റിക് ഡാറ്റയെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾക്ക്, സിന്തോ വെബ്സൈറ്റ് സന്ദർശിക്കുക അല്ലെങ്കിൽ വിം കീസ് ജാൻസനെ ബന്ധപ്പെടുക. SAS നെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾക്ക്, സന്ദർശിക്കുക www.sas.com അല്ലെങ്കിൽ kees@syntho.ai എന്ന വിലാസത്തിൽ ബന്ധപ്പെടുക.

ഈ ഉപയോഗ സാഹചര്യത്തിൽ, ഉദ്ദേശിച്ച ഫലങ്ങൾ കൈവരിക്കുന്നതിന് സിന്തോ, എസ്എഎസ്, എൻഎൽ എഐസി എന്നിവ ഒരുമിച്ച് പ്രവർത്തിക്കുന്നു. AI- ജനറേറ്റഡ് സിന്തറ്റിക് ഡാറ്റയിൽ വിദഗ്ദ്ധനാണ് സിന്തോ, അനലിറ്റിക്‌സിൽ SAS ഒരു മാർക്കറ്റ് ലീഡറാണ് കൂടാതെ ഡാറ്റ പര്യവേക്ഷണം ചെയ്യാനും വിശകലനം ചെയ്യാനും ദൃശ്യവൽക്കരിക്കാനും സോഫ്റ്റ്‌വെയർ വാഗ്ദാനം ചെയ്യുന്നു.

* 2021 പ്രവചിക്കുന്നു - ഡിജിറ്റൽ ബിസിനസ്സ് നിയന്ത്രിക്കുന്നതിനും സ്കെയിൽ ചെയ്യുന്നതിനും പരിവർത്തനം ചെയ്യുന്നതിനുമുള്ള ഡാറ്റയും അനലിറ്റിക്‌സ് തന്ത്രങ്ങളും, ഗാർട്ട്‌നർ, 2020.

സിന്തോ ഗൈഡ് കവർ

നിങ്ങളുടെ സിന്തറ്റിക് ഡാറ്റ ഗൈഡ് ഇപ്പോൾ സംരക്ഷിക്കുക!