Syntho দ্বারা উত্পন্ন সিন্থেটিক ডেটা SAS-এর ডেটা বিশেষজ্ঞদের দ্বারা বাহ্যিক এবং উদ্দেশ্যমূলক দৃষ্টিকোণ থেকে মূল্যায়ন, যাচাই এবং অনুমোদিত হয়।
যদিও Syntho তার ব্যবহারকারীদের একটি উন্নত মানের নিশ্চয়তা প্রতিবেদন দিতে পেরে গর্বিত, আমরা শিল্প নেতাদের কাছ থেকে আমাদের সিন্থেটিক ডেটার একটি বাহ্যিক এবং উদ্দেশ্যমূলক মূল্যায়ন করার গুরুত্বও বুঝি। এই কারণেই আমরা আমাদের সিন্থেটিক ডেটা মূল্যায়ন করতে SAS, বিশ্লেষণে নেতার সাথে সহযোগিতা করি।
SAS মূল ডেটার তুলনায় Syntho-এর এআই-জেনারেটেড সিন্থেটিক ডেটার ডেটা-নির্ভুলতা, গোপনীয়তা সুরক্ষা এবং ব্যবহারযোগ্যতার উপর বিভিন্ন পুঙ্খানুপুঙ্খ মূল্যায়ন করে। উপসংহার হিসাবে, SAS সিন্থো-এর সিন্থেটিক ডেটাকে মূল ডেটার তুলনায় নির্ভুল, সুরক্ষিত এবং ব্যবহারযোগ্য হিসাবে মূল্যায়ন ও অনুমোদন করেছে।
আমরা টেলিকম ডেটা ব্যবহার করেছি যা লক্ষ্য ডেটা হিসাবে "মন্থন" পূর্বাভাসের জন্য ব্যবহৃত হয়। মূল্যায়নের লক্ষ্য ছিল বিভিন্ন মন্থন ভবিষ্যদ্বাণী মডেল প্রশিক্ষণের জন্য সিন্থেটিক ডেটা ব্যবহার করা এবং প্রতিটি মডেলের কর্মক্ষমতা মূল্যায়ন করা। যেহেতু মন্থন ভবিষ্যদ্বাণী একটি শ্রেণীবিভাগের কাজ, SAS ভবিষ্যদ্বাণী করার জন্য জনপ্রিয় শ্রেণীবিভাগ মডেলগুলি নির্বাচন করেছে, যার মধ্যে রয়েছে:
সিন্থেটিক ডেটা তৈরি করার আগে, এসএএস এলোমেলোভাবে টেলিকম ডেটাসেটকে একটি ট্রেন সেটে (মডেল প্রশিক্ষণের জন্য) এবং একটি হোল্ডআউট সেট (মডেল স্কোর করার জন্য) ভাগ করে। স্কোরিংয়ের জন্য একটি পৃথক হোল্ডআউট সেট থাকা একটি নিরপেক্ষ মূল্যায়নের অনুমতি দেয় যখন নতুন ডেটা প্রয়োগ করার সময় শ্রেণীবিভাগ মডেলটি কতটা ভাল করতে পারে।
ট্রেন সেটটিকে ইনপুট হিসাবে ব্যবহার করে, সিন্থো একটি সিন্থেটিক ডেটাসেট তৈরি করতে তার সিনথো ইঞ্জিন ব্যবহার করে। বেঞ্চমার্কিংয়ের জন্য, SAS একটি নির্দিষ্ট থ্রেশহোল্ডে (কে-অনামিতার) পৌঁছানোর জন্য বিভিন্ন বেনামী কৌশল প্রয়োগ করার পরে ট্রেন সেটের একটি বেনামী সংস্করণও তৈরি করেছে। পূর্ববর্তী পদক্ষেপগুলি চারটি ডেটাসেটে পরিণত হয়েছিল:
ডেটাসেট 1, 3 এবং 4 প্রতিটি শ্রেণিবিন্যাস মডেলকে প্রশিক্ষণের জন্য ব্যবহার করা হয়েছিল, যার ফলে 12টি (3 x 4) প্রশিক্ষিত মডেল। SAS পরবর্তীতে গ্রাহক মন্থনের ভবিষ্যদ্বাণীতে প্রতিটি মডেলের যথার্থতা পরিমাপ করতে হোল্ডআউট ডেটাসেট ব্যবহার করে।
SAS মূল ডেটার তুলনায় Syntho-এর এআই-জেনারেটেড সিন্থেটিক ডেটার ডেটা-নির্ভুলতা, গোপনীয়তা সুরক্ষা এবং ব্যবহারযোগ্যতার উপর বিভিন্ন পুঙ্খানুপুঙ্খ মূল্যায়ন করে। উপসংহার হিসাবে, SAS সিন্থো-এর সিন্থেটিক ডেটাকে মূল ডেটার তুলনায় নির্ভুল, সুরক্ষিত এবং ব্যবহারযোগ্য হিসাবে মূল্যায়ন ও অনুমোদন করেছে।
Syntho-এর কৃত্রিম ডেটা শুধুমাত্র মৌলিক প্যাটার্নের জন্যই ধারণ করে না, এটি উন্নত বিশ্লেষণমূলক কাজের জন্য প্রয়োজনীয় গভীর 'লুকানো' পরিসংখ্যানগত নিদর্শনগুলিও ক্যাপচার করে। পরেরটি বার চার্টে প্রদর্শিত হয়, যা নির্দেশ করে যে সিন্থেটিক ডেটাতে প্রশিক্ষিত মডেলের নির্ভুলতা বনাম মূল ডেটাতে প্রশিক্ষিত মডেলগুলি একই রকম। সুতরাং, সিন্থেটিক ডেটা মডেলগুলির প্রকৃত প্রশিক্ষণের জন্য ব্যবহার করা যেতে পারে। মূল ডেটার তুলনায় সিন্থেটিক ডেটাতে অ্যালগরিদম দ্বারা নির্বাচিত ইনপুট এবং পরিবর্তনশীল গুরুত্ব খুব একই রকম ছিল। সুতরাং, এটি উপসংহারে পৌঁছেছে যে মডেলিং প্রক্রিয়াটি বাস্তব সংবেদনশীল ডেটা ব্যবহারের বিকল্প হিসাবে সিন্থেটিক ডেটাতে করা যেতে পারে।
ক্লাসিক বেনামীকরণ কৌশলগুলি সাধারণ যে তারা ব্যক্তিদের সনাক্তকরণে বাধা দেওয়ার জন্য আসল ডেটা ম্যানিপুলেট করে। তারা ডেটা ম্যানিপুলেট করে এবং এর ফলে প্রক্রিয়ায় ডেটা ধ্বংস করে। আপনি যত বেশি বেনামী করবেন, তত ভাল আপনার ডেটা সুরক্ষিত হবে, তবে আরও আপনার ডেটা ধ্বংস হবে। এটি বিশেষত AI এবং মডেলিং কাজের জন্য বিধ্বংসী যেখানে "ভবিষ্যদ্বাণীমূলক শক্তি" অপরিহার্য, কারণ খারাপ মানের ডেটার ফলে AI মডেল থেকে খারাপ অন্তর্দৃষ্টি হবে৷ SAS এটি প্রদর্শন করেছে, বক্ররেখার অধীনে একটি এলাকা (AUC*) 0.5 এর কাছাকাছি, এটি প্রদর্শন করে যে বেনামী ডেটাতে প্রশিক্ষিত মডেলগুলি সবচেয়ে খারাপ কার্য সম্পাদন করে।
ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক এবং সম্পর্কগুলি সিন্থেটিক ডেটাতে সঠিকভাবে সংরক্ষিত ছিল।
এরিয়া আন্ডার দ্য কার্ভ (AUC), মডেল পারফরম্যান্স পরিমাপের একটি মেট্রিক, সামঞ্জস্যপূর্ণ ছিল।
তদ্ব্যতীত, পরিবর্তনশীল গুরুত্ব, যা একটি মডেলের ভেরিয়েবলের ভবিষ্যদ্বাণীমূলক শক্তি নির্দেশ করে, মূল ডেটাসেটের সাথে সিন্থেটিক ডেটা তুলনা করার সময় অক্ষত থাকে।
SAS এর এই পর্যবেক্ষণের উপর ভিত্তি করে এবং SAS Viya ব্যবহার করে, আমরা আত্মবিশ্বাসের সাথে উপসংহারে পৌঁছাতে পারি যে Syntho ইঞ্জিন দ্বারা উত্পন্ন সিন্থেটিক ডেটা প্রকৃতপক্ষে মানের দিক থেকে বাস্তব ডেটার সমতুল্য। এটি মডেল ডেভেলপমেন্টের জন্য সিন্থেটিক ডেটার ব্যবহার বৈধ করে, সিন্থেটিক ডেটা সহ উন্নত বিশ্লেষণের পথ তৈরি করে।