ስም-አልባ ውሂብ ከተሰራ ውሂብ ጋር

የውሂብ ትንታኔዎችን ከመሞከርዎ በፊት የእርስዎን ውሂብ ማንነታቸውን ከገለጹ፣ በጨዋታው ውስጥ በርካታ ምክንያቶች አሉ፡

  1. በሁሉም ጉዳዮች ማለት ይቻላል፣ ስም-አልባ መረጃዎች በተወሰኑ እና ልዩ ረድፎች (ለምሳሌ የህክምና መዝገቦች) ምክንያት አሁንም ወደ ግለሰቦች ሊገኙ ይችላሉ።
  2. ማንነትን በገለጽክ ቁጥር ወይም ባጠቃላይ፣ ብዙ ውሂብ ታጠፋለህ። ይህ የውሂብዎን ጥራት እና ስለዚህ ግንዛቤዎችዎን ይቀንሳል
  3. ማንነትን መደበቅ ለተለያዩ የውሂብ ቅርጸቶች በተለየ መንገድ ይሰራል። ይህ ማለት ሊሰፋ የማይችል እና ብዙ ጊዜ የሚወስድ ሊሆን ይችላል

ሰው ሠራሽ መረጃ እነዚህን ሁሉ ድክመቶች እና ሌሎችንም ይፈታል። ከዚህ በታች ያለውን ቪዲዮ ይመልከቱ ከኤስኤኤስ (የአለም አቀፍ ገበያ የትንታኔ መሪ) የትንታኔ ኤክስፐርት ስለ ኦሪጅናል ውሂብ፣ ስም-አልባ መረጃ እና በSyntho የመነጨ ሰው ሰራሽ ውሂብ መካከል ስላለው የጥራት ልዩነት ሲያብራራ ለማየት።

ይህ ቪዲዮ የተቀረፀው ከSyntho x SAS D[N] ስለ AI Generated Synthetic Data ካፌ ነው። ሙሉውን ቪዲዮ እዚህ ያግኙ።

ኤድዊን ቫን ኡነን ኦሪጅናል ዳታ ስብስብን ወደ Syntho ልከናል እና እኛ የመረጃ ቋቱን አቀናጅተናል። ነገር ግን ጥያቄው እንዲሁ ነበር፡- “ሰው ሰራሽ መረጃዎችን ከማይታወቅ መረጃ ጋር ብናወዳድር ምን ይሆናል?” ስም-አልባ በሆነ ውሂብ ውስጥ ብዙ መረጃ ስለሚያጡ፣ የውሂብ ስብስብን ሲያቀናጅም ይህ ይከሰታል? የጀመርነው ከቴሌኮሙኒኬሽን ኢንዱስትሪ በተገኘ መረጃ በ56.000 ረድፎች እና በ128 አምዶች የኩባንያ churn-መረጃ ነው። ይህ የውሂብ ስብስብ የተዋሃደ እና ስም-አልባ ስለሆነ ኤድዊን ስም-አልባነትን ከማሳየት ጋር ማነጻጸር ይችላል። ከዚያ ኤድዊን SAS Viyaን በመጠቀም ሞዴሊንግ ማድረግ ጀመረ። ክላሲካል ሪግሬሽን ቴክኒኮችን እና የውሳኔ ዛፎችን በመጠቀም፣ ነገር ግን እንደ ነርቭ ኔትወርኮች፣ ቀስ በቀስ ማሳደግ፣ የዘፈቀደ ደን - እነዚህን አይነት ቴክኒኮችን የመሳሰሉ በጣም የተራቀቁ ቴክኒኮችን በዋናው የመረጃ ቋት ላይ ጥንድ ጥንድ ሞዴሎችን ገንብቷል። ሞዴሎቹን በሚገነቡበት ጊዜ መደበኛውን የ SAS Viya አማራጮችን መጠቀም.

ከዚያም ውጤቱን ለመመልከት ጊዜው ነበር. ውጤቶቹ ለሰው ሰራሽ መረጃዎች በጣም ተስፋ ሰጭ እንጂ ማንነትን መደበቅ አልነበሩም። ለታዳሚው የማሽን ላልተማሩ ባለሙያዎች፣ ስለ ሞዴሉ ትክክለኛነት አንድ ነገር የሚናገረውን በ ROC-curve ስር ያለውን ቦታ እንመለከታለን። ዋናውን መረጃ ከማይታወቅ መረጃ ጋር በማነፃፀር የዋናው መረጃ ሞዴል በ ROC-curve of .8 ውስጥ አካባቢ እንዳለው እናያለን, ይህም በጣም ጥሩ ነው, ሆኖም ግን, ስም-አልባ ውሂብ በ ROC-curve of .6. ይህ ማለት ስም-አልባ በሆነው ሞዴል ብዙ መረጃዎችን እናጣለን ስለዚህም ብዙ የመተንበይ ኃይልን ታጣለህ።

ግን ከዚያ ጥያቄው ስለ ሰው ሠራሽ መረጃ ምን ማለት ነው? እዚህ፣ በትክክል ተመሳሳይ ነገር አድርገናል፣ ነገር ግን ውሂቡን ስም ከመስጠት ይልቅ፣ ሲንቶ ውሂቡን አዋህዷል። አሁን፣ ሁለቱም ኦሪጅናል ዳታ እና ሰው ሰራሽ መረጃዎች በ ROC-curve of .8 ስር አካባቢ እንዳላቸው እናያለን፣ ይህም በጣም ተመሳሳይ ነው። በተለዋዋጭነት ምክንያት በትክክል አንድ አይነት አይደለም, ግን በጣም ተመሳሳይ ነው. ይህ ማለት የሰው ሰራሽ መረጃ አቅም በጣም ተስፋ ሰጪ ነው - ኤድዊን በዚህ በጣም ደስተኛ ነው.

የሰዎች ቡድን ፈገግታ

መረጃ ሰው ሠራሽ ነው፣ ግን ቡድናችን እውነተኛ ነው!

ሲንቶን ያነጋግሩ እና ከባለሙያዎቻችን አንዱ የተቀናጀ መረጃን ዋጋ ለመመርመር በብርሃን ፍጥነት ከእርስዎ ጋር ይገናኛል!