SAS এর ডেটা বিশেষজ্ঞদের দ্বারা আমাদের সিন্থেটিক ডেটার বাহ্যিক মূল্যায়ন

আমাদের সিন্থেটিক তথ্য মূল্যায়ন এবং অনুমোদিত এর ডেটা বিশেষজ্ঞদের দ্বারা করা SAS

SAS এর ডেটা বিশেষজ্ঞদের দ্বারা আমাদের সিন্থেটিক ডেটার বাহ্যিক মূল্যায়নের ভূমিকা

আমরা কি করেছিলাম?

Syntho দ্বারা উত্পন্ন সিন্থেটিক ডেটা SAS-এর ডেটা বিশেষজ্ঞদের দ্বারা বাহ্যিক এবং উদ্দেশ্যমূলক দৃষ্টিকোণ থেকে মূল্যায়ন, যাচাই এবং অনুমোদিত হয়।

কেন আমাদের সিন্থেটিক ডেটা SAS-এর ডেটা বিশেষজ্ঞদের দ্বারা বাহ্যিকভাবে মূল্যায়ন করা হয়?

যদিও Syntho তার ব্যবহারকারীদের একটি উন্নত মানের নিশ্চয়তা প্রতিবেদন দিতে পেরে গর্বিত, আমরা শিল্প নেতাদের কাছ থেকে আমাদের সিন্থেটিক ডেটার একটি বাহ্যিক এবং উদ্দেশ্যমূলক মূল্যায়ন করার গুরুত্বও বুঝি। এই কারণেই আমরা আমাদের সিন্থেটিক ডেটা মূল্যায়ন করতে SAS, বিশ্লেষণে নেতার সাথে সহযোগিতা করি।

SAS মূল ডেটার তুলনায় Syntho-এর এআই-জেনারেটেড সিন্থেটিক ডেটার ডেটা-নির্ভুলতা, গোপনীয়তা সুরক্ষা এবং ব্যবহারযোগ্যতার উপর বিভিন্ন পুঙ্খানুপুঙ্খ মূল্যায়ন করে। উপসংহার হিসাবে, SAS সিন্থো-এর সিন্থেটিক ডেটাকে মূল ডেটার তুলনায় নির্ভুল, সুরক্ষিত এবং ব্যবহারযোগ্য হিসাবে মূল্যায়ন ও অনুমোদন করেছে।

এই মূল্যায়নের সময় SAS কি করেছে?

আমরা টেলিকম ডেটা ব্যবহার করেছি যা লক্ষ্য ডেটা হিসাবে "মন্থন" পূর্বাভাসের জন্য ব্যবহৃত হয়। মূল্যায়নের লক্ষ্য ছিল বিভিন্ন মন্থন ভবিষ্যদ্বাণী মডেল প্রশিক্ষণের জন্য সিন্থেটিক ডেটা ব্যবহার করা এবং প্রতিটি মডেলের কর্মক্ষমতা মূল্যায়ন করা। যেহেতু মন্থন ভবিষ্যদ্বাণী একটি শ্রেণীবিভাগের কাজ, SAS ভবিষ্যদ্বাণী করার জন্য জনপ্রিয় শ্রেণীবিভাগ মডেলগুলি নির্বাচন করেছে, যার মধ্যে রয়েছে:

  1. এলোমেলো বন
  2. গ্রেডিয়েন্ট বুস্টিং
  3. পণ্য সরবরাহ সংশ্লেষণ
  4. স্নায়বিক নেটওয়ার্ক

সিন্থেটিক ডেটা তৈরি করার আগে, এসএএস এলোমেলোভাবে টেলিকম ডেটাসেটকে একটি ট্রেন সেটে (মডেল প্রশিক্ষণের জন্য) এবং একটি হোল্ডআউট সেট (মডেল স্কোর করার জন্য) ভাগ করে। স্কোরিংয়ের জন্য একটি পৃথক হোল্ডআউট সেট থাকা একটি নিরপেক্ষ মূল্যায়নের অনুমতি দেয় যখন নতুন ডেটা প্রয়োগ করার সময় শ্রেণীবিভাগ মডেলটি কতটা ভাল করতে পারে।

ট্রেন সেটটিকে ইনপুট হিসাবে ব্যবহার করে, সিন্থো একটি সিন্থেটিক ডেটাসেট তৈরি করতে তার সিনথো ইঞ্জিন ব্যবহার করে। বেঞ্চমার্কিংয়ের জন্য, SAS একটি নির্দিষ্ট থ্রেশহোল্ডে (কে-অনামিতার) পৌঁছানোর জন্য বিভিন্ন বেনামী কৌশল প্রয়োগ করার পরে ট্রেন সেটের একটি বেনামী সংস্করণও তৈরি করেছে। পূর্ববর্তী পদক্ষেপগুলি চারটি ডেটাসেটে পরিণত হয়েছিল:

  1. একটি ট্রেন ডেটাসেট (যেমন মূল ডেটাসেট বিয়োগ হোল্ডআউট ডেটাসেট)
  2. একটি হোল্ডআউট ডেটাসেট (যেমন মূল ডেটাসেটের একটি উপসেট)
  3. একটি বেনামী ডেটাসেট (ট্রেন ডেটাসেটের বেনামী ডেটা, মূল ডেটাসেট বিয়োগ হোল্ডআউট ডেটাসেট)
  4. একটি সিন্থেটিক ডেটাসেট (ট্রেন ডেটাসেটের সংশ্লেষিত ডেটা, মূল ডেটাসেট বিয়োগ হোল্ডআউট ডেটাসেট)

ডেটাসেট 1, 3 এবং 4 প্রতিটি শ্রেণিবিন্যাস মডেলকে প্রশিক্ষণের জন্য ব্যবহার করা হয়েছিল, যার ফলে 12টি (3 x 4) প্রশিক্ষিত মডেল। SAS পরবর্তীতে গ্রাহক মন্থনের ভবিষ্যদ্বাণীতে প্রতিটি মডেলের যথার্থতা পরিমাপ করতে হোল্ডআউট ডেটাসেট ব্যবহার করে।

SAS মূল ডেটার তুলনায় Syntho-এর এআই-জেনারেটেড সিন্থেটিক ডেটার ডেটা-নির্ভুলতা, গোপনীয়তা সুরক্ষা এবং ব্যবহারযোগ্যতার উপর বিভিন্ন পুঙ্খানুপুঙ্খ মূল্যায়ন করে। উপসংহার হিসাবে, SAS সিন্থো-এর সিন্থেটিক ডেটাকে মূল ডেটার তুলনায় নির্ভুল, সুরক্ষিত এবং ব্যবহারযোগ্য হিসাবে মূল্যায়ন ও অনুমোদন করেছে।

আপনি কি কিছু জানতে চান?

আমাদের বিশেষজ্ঞদের একজনের সাথে কথা বলুন

SAS দ্বারা ডেটা মূল্যায়নের প্রাথমিক ফলাফল

সিন্থেটিক ডেটাতে প্রশিক্ষিত মডেলগুলি মূল ডেটাতে প্রশিক্ষিত মডেলগুলির তুলনায় অত্যন্ত অনুরূপ

Syntho-এর কৃত্রিম ডেটা শুধুমাত্র মৌলিক প্যাটার্নের জন্যই ধারণ করে না, এটি উন্নত বিশ্লেষণমূলক কাজের জন্য প্রয়োজনীয় গভীর 'লুকানো' পরিসংখ্যানগত নিদর্শনগুলিও ক্যাপচার করে। পরেরটি বার চার্টে প্রদর্শিত হয়, যা নির্দেশ করে যে সিন্থেটিক ডেটাতে প্রশিক্ষিত মডেলের নির্ভুলতা বনাম মূল ডেটাতে প্রশিক্ষিত মডেলগুলি একই রকম। সুতরাং, সিন্থেটিক ডেটা মডেলগুলির প্রকৃত প্রশিক্ষণের জন্য ব্যবহার করা যেতে পারে। মূল ডেটার তুলনায় সিন্থেটিক ডেটাতে অ্যালগরিদম দ্বারা নির্বাচিত ইনপুট এবং পরিবর্তনশীল গুরুত্ব খুব একই রকম ছিল। সুতরাং, এটি উপসংহারে পৌঁছেছে যে মডেলিং প্রক্রিয়াটি বাস্তব সংবেদনশীল ডেটা ব্যবহারের বিকল্প হিসাবে সিন্থেটিক ডেটাতে করা যেতে পারে।

কেন বেনামী ডেটাতে প্রশিক্ষিত মডেলের স্কোর খারাপ হয়?

ক্লাসিক বেনামীকরণ কৌশলগুলি সাধারণ যে তারা ব্যক্তিদের সনাক্তকরণে বাধা দেওয়ার জন্য আসল ডেটা ম্যানিপুলেট করে। তারা ডেটা ম্যানিপুলেট করে এবং এর ফলে প্রক্রিয়ায় ডেটা ধ্বংস করে। আপনি যত বেশি বেনামী করবেন, তত ভাল আপনার ডেটা সুরক্ষিত হবে, তবে আরও আপনার ডেটা ধ্বংস হবে। এটি বিশেষত AI এবং মডেলিং কাজের জন্য বিধ্বংসী যেখানে "ভবিষ্যদ্বাণীমূলক শক্তি" অপরিহার্য, কারণ খারাপ মানের ডেটার ফলে AI মডেল থেকে খারাপ অন্তর্দৃষ্টি হবে৷ SAS এটি প্রদর্শন করেছে, বক্ররেখার অধীনে একটি এলাকা (AUC*) 0.5 এর কাছাকাছি, এটি প্রদর্শন করে যে বেনামী ডেটাতে প্রশিক্ষিত মডেলগুলি সবচেয়ে খারাপ কার্য সম্পাদন করে।

SAS দ্বারা সিন্থেটিক ডেটা মূল্যায়নের অতিরিক্ত ফলাফল

SAS দ্বারা সিন্থেটিক ডেটা মূল্যায়নের অতিরিক্ত ফলাফল

ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক এবং সম্পর্কগুলি সিন্থেটিক ডেটাতে সঠিকভাবে সংরক্ষিত ছিল।

এরিয়া আন্ডার দ্য কার্ভ (AUC), মডেল পারফরম্যান্স পরিমাপের একটি মেট্রিক, সামঞ্জস্যপূর্ণ ছিল।

তদ্ব্যতীত, পরিবর্তনশীল গুরুত্ব, যা একটি মডেলের ভেরিয়েবলের ভবিষ্যদ্বাণীমূলক শক্তি নির্দেশ করে, মূল ডেটাসেটের সাথে সিন্থেটিক ডেটা তুলনা করার সময় অক্ষত থাকে।

SAS এর এই পর্যবেক্ষণের উপর ভিত্তি করে এবং SAS Viya ব্যবহার করে, আমরা আত্মবিশ্বাসের সাথে উপসংহারে পৌঁছাতে পারি যে Syntho ইঞ্জিন দ্বারা উত্পন্ন সিন্থেটিক ডেটা প্রকৃতপক্ষে মানের দিক থেকে বাস্তব ডেটার সমতুল্য। এটি মডেল ডেভেলপমেন্টের জন্য সিন্থেটিক ডেটার ব্যবহার বৈধ করে, সিন্থেটিক ডেটা সহ উন্নত বিশ্লেষণের পথ তৈরি করে।

এসএএস-এর ডেটা বিশেষজ্ঞদের দ্বারা উপসংহার

সাস লোগো

আমাদের সিন্থেটিক তথ্য অনুমোদিত SAS এর ডেটা বিশেষজ্ঞদের দ্বারা

রেফারেন্স নিবন্ধ

সিনথো গাইড কভার

এখন আপনার সিন্থেটিক ডেটা গাইড সংরক্ষণ করুন!