সিনথেটিক ডেটা কি?

একটি ক্র্যাশ কোর্স সিন্থেটিক ডেটা

 

 

ভূমিকা

সিনথেটিক ডেটা কি?

উত্তর তুলনামূলকভাবে সহজ। যেখানে আসল তথ্য সংগ্রহ করা হয় প্রকৃত ব্যক্তিদের (যেমন ক্লায়েন্ট, রোগী, কর্মচারী ইত্যাদি) সাথে আপনার সমস্ত মিথস্ক্রিয়ায় এবং আপনার সমস্ত অভ্যন্তরীণ প্রক্রিয়ার মাধ্যমে, সিন্থেটিক ডেটা একটি কম্পিউটার অ্যালগরিদম দ্বারা তৈরি করা হয়। এই কম্পিউটার অ্যালগরিদম সম্পূর্ণ নতুন এবং কৃত্রিম ডেটাপয়েন্ট তৈরি করে।

ডেটা গোপনীয়তার চ্যালেঞ্জগুলি সমাধান করুন

কৃত্রিমভাবে তৈরি করা ডেটা সম্পূর্ণ নতুন এবং কৃত্রিম ডেটাপয়েন্ট নিয়ে গঠিত যার মূল ডেটার সাথে কোনো সম্পর্ক নেই। সুতরাং, সিন্থেটিক ডেটাপয়েন্টগুলির কোনওটিই আসল ডেটাতে ফিরে বা বিপরীত প্রকৌশলী করা যায় না। ফলস্বরূপ, সিন্থেটিক ডেটা গোপনীয়তা প্রবিধান থেকে মুক্ত, যেমন জিডিপিআর এবং ডেটা-গোপনীয়তা চ্যালেঞ্জগুলি সমাধান ও কাটিয়ে উঠতে সমাধান হিসাবে কাজ করে।

বৃদ্ধি এবং অনুকরণ

সিন্থেটিক ডেটা জেনারেশনের জেনারেটিভ দিকটি সম্পূর্ণ নতুন ডেটা বাড়াতে এবং অনুকরণ করতে দেয়। এটি সমাধান হিসাবে কাজ করে যখন আপনার কাছে পর্যাপ্ত ডেটা না থাকে (ডেটা ঘাটতি), নমুনা এজ-কেস বা যখন আপনার কাছে এখনও ডেটা না থাকে।

এখানে, সিন্থোর ফোকাস হল স্ট্রাকচার্ড ডেটা (সারি এবং কলাম সম্বলিত টেবিলগুলোতে ফরম্যাট করা ডেটা, যেমন আপনি একটি এক্সেল শীটে দেখেন), কিন্তু আমরা সবসময় ছবির মাধ্যমে সিনথেটিক ডেটার ধারণাকে ব্যাখ্যা করতে পছন্দ করি, কারণ এটি আরো আকর্ষণীয়।

সিন্থেটিক ডেটার ধরন

সিন্থেটিক ডেটা ছাতার মধ্যে তিন ধরণের সিন্থেটিক ডেটা বিদ্যমান। সেই 3 ধরনের সিন্থেটিক ডেটা হল: ডামি ডেটা, নিয়ম-ভিত্তিক তৈরি সিন্থেটিক ডেটা এবং কৃত্রিম বুদ্ধিমত্তা (AI) দ্বারা তৈরি সিন্থেটিক ডেটা। আমরা শীঘ্রই ব্যাখ্যা করি যে 3টি বিভিন্ন ধরণের সিন্থেটিক ডেটা কী।

ডামি ডেটা / মক ডেটা

ডামি ডেটা এলোমেলোভাবে তৈরি করা ডেটা (যেমন একটি মক ডেটা জেনারেটর দ্বারা)।

ফলস্বরূপ, মূল ডেটাতে থাকা বৈশিষ্ট্য, সম্পর্ক এবং পরিসংখ্যানগত নিদর্শনগুলি তৈরি করা ডামি ডেটাতে সংরক্ষিত, ক্যাপচার এবং পুনরুত্পাদন করা হয় না। তাই, ডামি ডেটা/মক ডেটার প্রতিনিধিত্ব মূল ডেটার তুলনায় ন্যূনতম।

  • কখন এটি ব্যবহার করবেন: সরাসরি শনাক্তকারী (PII) প্রতিস্থাপন করতে বা যখন আপনার কাছে ডেটা নেই (এখনও) এবং নিয়মগুলি সংজ্ঞায়িত করার জন্য সময় এবং শক্তি ব্যয় করতে চান না৷

নিয়ম ভিত্তিক জেনারেট সিনথেটিক ডেটা

নিয়ম-ভিত্তিক জেনারেটেড সিন্থেটিক ডেটা হল পূর্ব-নির্ধারিত নিয়মের সেট দ্বারা তৈরি সিন্থেটিক ডেটা। এই পূর্ব-নির্ধারিত নিয়মগুলির উদাহরণ হল আপনি একটি নির্দিষ্ট সর্বনিম্ন মান, সর্বোচ্চ মান বা গড় মান সহ সিন্থেটিক ডেটা রাখতে চান৷ যে কোনো বৈশিষ্ট্য, সম্পর্ক এবং পরিসংখ্যানগত নিদর্শন, যা আপনি নিয়ম-ভিত্তিক তৈরিকৃত সিন্থেটিক ডেটাতে পুনরুত্পাদন করতে চান, তা পূর্ব-সংজ্ঞায়িত করা প্রয়োজন।

ফলস্বরূপ, ডেটার মান পূর্ব-নির্ধারিত নিয়মের সেটের মতোই ভাল হবে। উচ্চ ডেটা গুণমান যখন সারমর্ম হয় তখন এটি চ্যালেঞ্জের মধ্যে পড়ে। প্রথমত, কেউ সিন্থেটিক ডেটাতে ক্যাপচার করার জন্য নিয়মের একটি সীমিত সেট সংজ্ঞায়িত করতে পারে। উপরন্তু, একাধিক নিয়ম সেট আপ করার ফলে সাধারণত ওভারল্যাপিং এবং বিরোধপূর্ণ নিয়ম হয়। অধিকন্তু, আপনি কখনই সমস্ত প্রাসঙ্গিক নিয়মগুলিকে পুরোপুরি কভার করবেন না। উপরন্তু, এমন কিছু প্রাসঙ্গিক নিয়ম থাকতে পারে যা আপনি জানেন না। এবং অবশেষে (এবং ভুলে যাওয়া নয়), এটি আপনাকে অনেক সময় এবং শক্তি নেবে যার ফলে একটি অ-দক্ষ সমাধান হবে।

  • কখন এটি ব্যবহার করবেন: যখন আপনার কাছে ডেটা নেই (এখনও)

কৃত্রিম বুদ্ধিমত্তা (AI) দ্বারা উত্পন্ন সিন্থেটিক ডেটা

আপনি নাম থেকে আশা করছেন, কৃত্রিম বুদ্ধিমত্তা (AI) দ্বারা উত্পন্ন সিন্থেটিক ডেটা হল একটি কৃত্রিম বুদ্ধিমত্তা (AI) অ্যালগরিদম দ্বারা উত্পন্ন সিন্থেটিক ডেটা। সমস্ত বৈশিষ্ট্য, সম্পর্ক এবং পরিসংখ্যানগত নিদর্শনগুলি শিখতে এআই মডেলটিকে মূল ডেটাতে প্রশিক্ষণ দেওয়া হয়। তারপরে, এই AI অ্যালগরিদম সম্পূর্ণ নতুন ডেটাপয়েন্ট তৈরি করতে এবং সেই নতুন ডেটাপয়েন্টগুলিকে এমনভাবে মডেল করতে সক্ষম হয় যাতে এটি মূল ডেটাসেট থেকে বৈশিষ্ট্য, সম্পর্ক এবং পরিসংখ্যানগত নিদর্শনগুলি পুনরুত্পাদন করে। এটাকে আমরা সিন্থেটিক ডাটা টুইন বলি।

এআই মডেল সিন্থেটিক ডেটা টুইন তৈরি করতে আসল ডেটার অনুকরণ করে যা ব্যবহার করা যেতে পারে-যদি এটি আসল ডেটা হয়। এটি বিভিন্ন ব্যবহারের ক্ষেত্রে আনলক করে যেখানে AI উৎপন্ন সিন্থেটিক ডেটা আসল (সংবেদনশীল) ডেটা ব্যবহার করার বিকল্প হিসাবে ব্যবহার করা যেতে পারে, যেমন AI জেনারেটেড সিন্থেটিক ডেটা পরীক্ষার ডেটা, ডেমো ডেটা বা বিশ্লেষণের জন্য ব্যবহার করা।

একটি ভিজ্যুয়ালাইজেশন কিভাবে সিন্থেটিক ডেটা তৈরি করা হয়

নিয়ম-ভিত্তিক জেনারেটেড সিন্থেটিক ডেটার তুলনায়: আপনি প্রাসঙ্গিক নিয়ম অধ্যয়ন এবং সংজ্ঞায়িত করার পরিবর্তে, এআই অ্যালগরিদম আপনার জন্য স্বয়ংক্রিয়ভাবে এটি করে। এখানে, শুধুমাত্র বৈশিষ্ট্য, সম্পর্ক এবং পরিসংখ্যানগত নিদর্শনগুলিই কভার করা হবে যা আপনি জানেন, সেই সাথে এমন বৈশিষ্ট্য, সম্পর্ক এবং পরিসংখ্যানগত নিদর্শনগুলিও কভার করা হবে যা আপনি জানেন না।

  • কখন এটি ব্যবহার করবেন: যখন আপনার কাছে (কিছু) ডেটা অনুকরণ করার জন্য ইনপুট হিসাবে থাকে বা স্মার্ট ডেটা তৈরি এবং বৃদ্ধির বৈশিষ্ট্যগুলির জন্য শুরুর পয়েন্ট হিসাবে ব্যবহার করতে হয়

কি ধরনের সিন্থেটিক ডেটা ব্যবহার করতে হবে?

আপনার ব্যবহারের ক্ষেত্রে নির্ভর করে, ডামি ডেটা / মক ডেটা, নিয়ম-ভিত্তিক জেনারেটেড সিন্থেটিক ডেটা বা কৃত্রিম বুদ্ধিমত্তা (AI) দ্বারা তৈরি সিন্থেটিক ডেটার সংমিশ্রণের পরামর্শ দেওয়া হয়। এই ওভারভিউ আপনাকে কোন ধরনের সিন্থেটিক ডেটা ব্যবহার করতে হবে তার প্রথম ইঙ্গিত দেয়। যেহেতু Syntho তাদের সকলকে সমর্থন করে, আমাদের সাথে আপনার ব্যবহারের ক্ষেত্রে গভীরভাবে জানতে আমাদের বিশেষজ্ঞদের সাথে নির্দ্বিধায় যোগাযোগ করুন।

এই চার্টটি বিভিন্ন ধরণের সিন্থেটিক ডেটা উপস্থাপন করে

সিনথো গাইড কভার

এখন আপনার সিন্থেটিক ডেটা গাইড সংরক্ষণ করুন!