AI এর অদেখা অপরাধী: পক্ষপাতের ভিতর উন্মোচন করা

বায়াস ব্লগ সিরিজ: পার্ট 1

ভূমিকা

আমাদের বুদ্ধিমত্তার ক্রমবর্ধমান কৃত্রিম রূপের বিশ্বে, জটিল সিদ্ধান্ত নেওয়ার দায়িত্বপ্রাপ্ত মেশিনগুলি আরও বেশি প্রচলিত হয়ে উঠছে। বিভিন্ন ডোমেনে যেমন ব্যবসা, উচ্চ-স্টেকের সিদ্ধান্ত গ্রহণ এবং চিকিৎসা খাতে গত কয়েক বছরে এআই-এর ব্যবহার নির্দেশ করে সাহিত্যের একটি ক্রমবর্ধমান অংশ রয়েছে। এই ক্রমবর্ধমান প্রসারের সাথে, তবে, লোকেরা উল্লিখিত সিস্টেমগুলির প্রবণতাগুলি লক্ষ্য করেছে; অর্থাৎ, যদিও অন্তর্নিহিতভাবে ডেটাতে নিদর্শনগুলি অনুসরণ করার জন্য ডিজাইন করা হয়েছে, তারা কুসংস্কারের লক্ষণ দেখিয়েছে, এই অর্থে যে বিভিন্ন যৌনতাবাদী এবং বৈষম্যমূলক আচরণ লক্ষ্য করা যায়। সাম্প্রতিক ইউরোপীয় এআই আইন, এই ধরনের কুসংস্কারের বিষয়টিকে বরং ব্যাপকভাবে কভার করে এবং এর সাথে সম্পর্কিত সমস্যাগুলি মোকাবেলার জন্য একটি ভিত্তি স্থাপন করে।

প্রযুক্তিগত ডকুমেন্টেশনের বছরের পর বছর ধরে, লোকেরা নির্দিষ্ট জনসংখ্যার প্রতি এই তির্যক ধরনের আচরণকে বর্ণনা করার জন্য "পক্ষপাত" শব্দটি ব্যবহার করার প্রবণতা দেখায়; একটি শব্দ যার অর্থ পরিবর্তিত হয়, বিভ্রান্তি সৃষ্টি করে এবং এটিকে সমাধান করার কাজকে জটিল করে তোলে।

এই নিবন্ধটি পক্ষপাতের বিষয়টিকে কভার করে ব্লগ পোস্টগুলির একটি সিরিজের প্রথম। এই সিরিজে, আমরা আপনাকে AI-তে পক্ষপাত সম্পর্কে একটি পরিষ্কার, হজমযোগ্য বোঝার দেওয়ার লক্ষ্য রাখব। আমরা পক্ষপাত পরিমাপ এবং হ্রাস করার উপায়গুলি প্রবর্তন করব এবং আরও ন্যায্য সিস্টেমে এই পথে সিন্থেটিক ডেটার ভূমিকা অন্বেষণ করব৷ সিন্থেটিক ডেটা জেনারেশনের একটি নেতৃস্থানীয় প্লেয়ার Syntho কীভাবে এই প্রচেষ্টায় অবদান রাখতে পারে সে বিষয়েও আমরা আপনাকে উঁকি দেব। সুতরাং, আপনি একজন অনুশীলনকারী হন যা কর্মযোগ্য অন্তর্দৃষ্টি খুঁজছেন বা এই বিষয় সম্পর্কে শুধু কৌতূহলী, আপনি সঠিক জায়গায় আছেন।

অ্যাকশনে পক্ষপাত: একটি বাস্তব-বিশ্বের উদাহরণ

আপনি হয়তো ভাবছেন, "AI তে এই পক্ষপাত সবই গুরুত্বপূর্ণ, কিন্তু আমার জন্য, সাধারণ মানুষের জন্য এর অর্থ কী?" সত্য হল, প্রভাব সুদূরপ্রসারী, প্রায়ই অদৃশ্য কিন্তু শক্তিশালী। AI-তে পক্ষপাত নিছক একাডেমিক ধারণা নয়; এটি গুরুতর পরিণতি সহ একটি বাস্তব-বিশ্বের সমস্যা।

একটি উদাহরণ হিসাবে ডাচ শিশু কল্যাণ কেলেঙ্কারি নিন। স্বয়ংক্রিয় সিস্টেম, অনুমিতভাবে ন্যূনতম মানব হস্তক্ষেপের সাথে ন্যায্য এবং দক্ষ ফলাফল তৈরি করার জন্য তৈরি একটি সরঞ্জাম, পক্ষপাতদুষ্ট ছিল। এটি ভুল তথ্য এবং অনুমানের উপর ভিত্তি করে জালিয়াতির জন্য হাজার হাজার অভিভাবককে ভুলভাবে পতাকাঙ্কিত করেছে। ফলাফল? এআই সিস্টেমের পক্ষপাতিত্বের কারণে পরিবারগুলি অশান্তি, ব্যক্তিগত খ্যাতি ক্ষতিগ্রস্ত এবং আর্থিক অসুবিধার মধ্যে পড়ে। এটি এই ধরনের উদাহরণ যা AI-তে পক্ষপাতিত্ব মোকাবেলার জরুরিতা তুলে ধরে।

উৎস: "2030 সাল পর্যন্ত ক্ষতিপূরণ দিতে হবে, 2023. মার্কিন

তবে আসুন সেখানে থামি না। এই ঘটনাটি পক্ষপাতিত্ব ধ্বংসের বিচ্ছিন্ন ঘটনা নয়। AI-তে পক্ষপাতিত্বের প্রভাব আমাদের জীবনের সমস্ত কোণে প্রসারিত। কাকে চাকরির জন্য নিয়োগ দেওয়া হয়, কে ঋণের জন্য অনুমোদন পায়, কে কী ধরনের চিকিৎসা পায় - পক্ষপাতদুষ্ট এআই সিস্টেম বিদ্যমান অসমতাকে স্থায়ী করতে পারে এবং নতুনগুলি তৈরি করতে পারে।

এটি বিবেচনা করুন: পক্ষপাতমূলক ঐতিহাসিক তথ্যের উপর প্রশিক্ষিত একটি AI সিস্টেম শুধুমাত্র তাদের লিঙ্গ বা জাতিগততার কারণে একজন সু-যোগ্য প্রার্থীকে চাকরি অস্বীকার করতে পারে। অথবা একটি পক্ষপাতদুষ্ট এআই সিস্টেম তাদের পোস্টকোডের কারণে একজন যোগ্য প্রার্থীকে ঋণ অস্বীকার করতে পারে। এগুলো শুধু অনুমানমূলক দৃশ্যকল্প নয়; তারা এখন ঘটছে.

ঐতিহাসিক পক্ষপাত এবং পরিমাপের পক্ষপাতের মতো নির্দিষ্ট ধরণের পক্ষপাতগুলি এই ধরনের ত্রুটিপূর্ণ সিদ্ধান্তের দিকে পরিচালিত করে। তারা তথ্যের অন্তর্নিহিত, সামাজিক পক্ষপাতের মধ্যে গভীরভাবে প্রোথিত, এবং বিভিন্ন জনসংখ্যার গোষ্ঠীর মধ্যে অসম ফলাফলে প্রতিফলিত হয়। তারা ভবিষ্যদ্বাণীমূলক মডেলের সিদ্ধান্তগুলিকে তিরস্কার করতে পারে এবং অন্যায় আচরণের ফলস্বরূপ।

জিনিসের বিশাল পরিকল্পনায়, AI-তে পক্ষপাতিত্ব একটি নীরব প্রভাবক হিসাবে কাজ করতে পারে, সূক্ষ্মভাবে আমাদের সমাজ এবং আমাদের জীবনকে গঠন করতে পারে, প্রায়শই এমনভাবে আমরা বুঝতে পারি না। এই সমস্ত উপরে উল্লিখিত পয়েন্টগুলি আপনাকে প্রশ্ন করতে পারে কেন থামানোর জন্য পদক্ষেপ নেওয়া হয়নি এবং এটি সম্ভব কিনা।

প্রকৃতপক্ষে, নতুন প্রযুক্তিগত অগ্রগতির সাথে এই ধরনের সমস্যা মোকাবেলা করার জন্য এটি ক্রমবর্ধমান আরও অ্যাক্সেসযোগ্য হয়ে ওঠে। এই সমস্যা মোকাবেলার প্রথম পদক্ষেপ, তবে, এর অস্তিত্ব এবং প্রভাব বোঝা এবং স্বীকার করা। আপাতত, এর অস্তিত্বের স্বীকৃতি তৈরি করা হয়েছে, "বোঝার" ব্যাপারটিকে এখনও বেশ অস্পষ্ট করে রেখেছে।

বায়াস বোঝা

পক্ষপাতের মূল সংজ্ঞা হিসাবে উপস্থাপিত কেমব্রিজ অভিধান শব্দের মূল উদ্দেশ্য থেকে খুব বেশি দূরে সরে যায় না কারণ এটি AI এর সাথে সম্পর্কিত, এমনকি এই একক সংজ্ঞার জন্য অনেকগুলি ভিন্ন ব্যাখ্যা তৈরি করতে হবে। Taxonomies, যেমন গবেষকদের দ্বারা উপস্থাপিত যেমন Hellström et al (2020) এবং Kliegr (2021), পক্ষপাতের সংজ্ঞা সম্পর্কে গভীর অন্তর্দৃষ্টি প্রদান করুন। এই কাগজপত্রগুলিতে একটি সাধারণ নজরে দেখা যাবে, যাইহোক, সমস্যাটিকে কার্যকরভাবে মোকাবেলা করার জন্য শব্দটির সংজ্ঞার একটি বড় সংকীর্ণতা প্রয়োজন।

ইভেন্টের পরিবর্তন হওয়া সত্ত্বেও, পক্ষপাতের অর্থ সর্বোত্তমভাবে সংজ্ঞায়িত করতে এবং বোঝানোর জন্য কেউ বিপরীতটিকে আরও ভালভাবে সংজ্ঞায়িত করতে পারে, সেটি হল ন্যায্যতা।

ন্যায্যতা সংজ্ঞায়িত করা 

যেমন বিভিন্ন সাম্প্রতিক সাহিত্য যেমন সংজ্ঞায়িত করা হয় Castelnovo et al. (2022)সম্ভাব্য স্থান শব্দটি বোঝার ভিত্তিতে ন্যায্যতা বিশদভাবে ব্যাখ্যা করা যেতে পারে। যেহেতু এটি বিদ্যমান, সম্ভাব্য স্থান (PS) একটি নির্দিষ্ট জনসংখ্যার গোষ্ঠীর অন্তর্গত নির্বিশেষে একজন ব্যক্তির ক্ষমতা এবং জ্ঞানের পরিমাণকে বোঝায়। PS-এর ধারণার এই সংজ্ঞার প্রেক্ষিতে, কেউ সহজেই নিরপেক্ষতাকে সংজ্ঞায়িত করতে পারে সমান PS-এর দুই ব্যক্তির মধ্যে আচরণের সমতা, পক্ষপাত প্ররোচিত পরামিতিগুলিতে (যেমন জাতি, বয়স, বা লিঙ্গ) তাদের পর্যবেক্ষণযোগ্য এবং লুকানো পার্থক্য নির্বিশেষে। এই সংজ্ঞা থেকে যেকোনো বিচ্যুতি, যাকে সুযোগের সমতাও বলা হয়, এটি পক্ষপাতের একটি স্পষ্ট ইঙ্গিত এবং আরও তদন্তের যোগ্যতা।

পাঠকদের মধ্যে অনুশীলনকারীরা লক্ষ্য করতে পারেন যে এখানে সংজ্ঞায়িত কিছু অর্জন করা আমাদের বিশ্বে বিদ্যমান অন্তর্নিহিত পক্ষপাতের কারণে সম্পূর্ণরূপে অসম্ভব হতে পারে। ঐটা সত্য! এই বিশ্বের ঘটনা থেকে সংগৃহীত সমস্ত ডেটা সহ আমরা যে পৃথিবীতে বাস করি তা অনেক ঐতিহাসিক এবং পরিসংখ্যানগত পক্ষপাতের বিষয়। এটি, প্রকৃতপক্ষে, এই ধরনের "পক্ষপাতমূলক" ডেটাতে প্রশিক্ষিত ভবিষ্যদ্বাণীমূলক মডেলগুলিতে পক্ষপাতের প্রভাবগুলিকে সম্পূর্ণরূপে প্রশমিত করার আত্মবিশ্বাসকে হ্রাস করে। যাইহোক, বিভিন্ন পদ্ধতি ব্যবহার করে, কেউ পক্ষপাতের প্রভাবগুলি কমানোর চেষ্টা করতে পারে। এই ক্ষেত্রে, এই ব্লগ পোস্টের বাকি অংশে ব্যবহৃত পরিভাষাগুলি সম্পূর্ণরূপে প্রশমিত করার পরিবর্তে পক্ষপাতের প্রভাব হ্রাস করার ধারণার দিকে সরে যাবে৷

ঠিক আছে! সুতরাং এখন যে পক্ষপাত কী এবং কীভাবে কেউ এর অস্তিত্বের সম্ভাব্য মূল্যায়ন করতে পারে সে সম্পর্কে একটি ধারণা আনা হয়েছে; আমরা যদি সমস্যাটি সঠিকভাবে মোকাবেলা করতে চাই তবে, আমাদের জানতে হবে যে এই সমস্ত পক্ষপাতের উৎপত্তি কোথা থেকে।

উত্স এবং প্রকারগুলি বোঝা

বিদ্যমান গবেষণা মেশিন লার্নিং এর বিভিন্ন ধরনের পক্ষপাতের মূল্যবান অন্তর্দৃষ্টি প্রদান করে। হিসাবে মেহরাবী প্রমুখ। আল (2019) মেশিন লার্নিং-এ পক্ষপাতগুলিকে ভাগ করার জন্য এগিয়ে গেছে, কেউ পক্ষপাতগুলিকে 3টি প্রধান বিভাগে ভাগ করতে পারে। যথা:

ডাটা টু অ্যালগরিদম: একটি ক্যাটাগরি এনকোম্যাপসিং বায়াস যা ডাটা থেকেই উদ্ভূত হয়। দুর্বল ডেটা সংগ্রহ, বিশ্বে বিদ্যমান সহজাত পক্ষপাত ইত্যাদির কারণে এটি হতে পারে।
অ্যালগরিদম টু ইউজার: অ্যালগরিদমগুলির ডিজাইন এবং কার্যকারিতা থেকে উদ্ভূত পক্ষপাতের উপর ফোকাস করে এমন একটি বিভাগ৷ এটি অন্তর্ভুক্ত করে যে কীভাবে অ্যালগরিদমগুলি অন্যদের উপর নির্দিষ্ট ডেটা পয়েন্টগুলিকে ব্যাখ্যা করতে, ওজন করতে বা বিবেচনা করতে পারে, যা পক্ষপাতদুষ্ট ফলাফলের দিকে নিয়ে যেতে পারে।
ব্যবহারকারী থেকে ডেটা: সিস্টেমের সাথে ব্যবহারকারীর মিথস্ক্রিয়া থেকে উদ্ভূত পক্ষপাতের সাথে সম্পর্কিত। ব্যবহারকারীরা যেভাবে ডেটা ইনপুট করে, তাদের অন্তর্নিহিত পক্ষপাতিত্ব, এমনকি সিস্টেম আউটপুটগুলিতে তাদের বিশ্বাস ফলাফলকে প্রভাবিত করতে পারে।

চিত্র 1: ডেটা মাইনিংয়ের জন্য CRISP-DM কাঠামোর একটি দৃশ্যায়ন; সাধারণত ডেটা মাইনিং-এ ব্যবহৃত হয় এবং যে পর্যায়ে পক্ষপাতিত্ব অস্তিত্বে আসতে পারে তা চিহ্নিত করার প্রক্রিয়ার সাথে প্রাসঙ্গিক।

যদিও নামগুলি পক্ষপাতিত্বের রূপের ইঙ্গিত দেয়, তখনও এই ছাতার শর্তাবলীর অধীনে শ্রেণীবদ্ধ করা হতে পারে এমন পক্ষপাতের প্রকারগুলি সম্পর্কে কারও কাছে প্রশ্ন থাকতে পারে। আমাদের পাঠকদের মধ্যে উত্সাহীদের জন্য, আমরা এই পরিভাষা এবং শ্রেণিবিন্যাসের সাথে সম্পর্কিত কিছু সাহিত্যের লিঙ্ক সরবরাহ করেছি। এই ব্লগ পোস্টে সরলতার জন্য, আমরা পরিস্থিতির সাথে প্রাসঙ্গিক কিছু বাছাই করা পক্ষপাতকে কভার করব (যার প্রায় সবকটিই অ্যালগরিদমের ক্যাটাগরির ডেটা)। নির্দিষ্ট ধরনের পক্ষপাত নিম্নরূপ:

ঐতিহাসিক পক্ষপাত: বিশ্বের বিভিন্ন সামাজিক গোষ্ঠী এবং সাধারণভাবে সমাজে বিদ্যমান প্রাকৃতিক পক্ষপাতের কারণে তথ্যের অন্তর্নিহিত এক ধরনের পক্ষপাত। বিশ্বে এই ডেটার অন্তর্নিহিততার কারণেই এটি নমুনা এবং বৈশিষ্ট্য নির্বাচনের বিভিন্ন উপায়ে প্রশমিত করা যায় না।
পরিমাপ পক্ষপাত ও প্রতিনিধিত্ব পক্ষপাত: এই দুটি ঘনিষ্ঠভাবে সম্পর্কিত পক্ষপাত ঘটে যখন ডেটাসেটের বিভিন্ন উপগোষ্ঠীতে অসম পরিমাণে "অনুকূল" ফলাফল থাকে। এই ধরনের পক্ষপাত তাই ভবিষ্যদ্বাণীমূলক মডেলের ফলাফলকে তির্যক করতে পারে
অ্যালগরিদমিক বায়াস: বায়াস সম্পূর্ণরূপে ব্যবহৃত অ্যালগরিদমের সাথে সম্পর্কিত। পরীক্ষায় যেমন দেখা গেছে (পোস্টে আরও বিস্তারিত বলা হয়েছে), এই ধরনের পক্ষপাত একটি প্রদত্ত অ্যালগরিদমের ন্যায্যতার উপর অসাধারণ প্রভাব ফেলতে পারে।

মেশিন লার্নিং-এ পক্ষপাতিত্বের এই মৌলিক উপলব্ধিগুলি পরবর্তী পোস্টগুলিতে আরও কার্যকরভাবে সমস্যাটি মোকাবেলা করার জন্য ব্যবহার করা হবে।

সর্বশেষ ভাবনা

কৃত্রিম বুদ্ধিমত্তার মধ্যে পক্ষপাতের এই অন্বেষণে, আমরা আমাদের ক্রমবর্ধমান AI-চালিত বিশ্বে এর গভীর প্রভাবগুলিকে আলোকিত করেছি। ডাচ শিশু কল্যাণ কেলেঙ্কারির মতো বাস্তব-বিশ্বের উদাহরণ থেকে পক্ষপাতের বিভাগ এবং প্রকারের জটিল সূক্ষ্মতা পর্যন্ত, এটা স্পষ্ট যে পক্ষপাতকে স্বীকৃতি দেওয়া এবং বোঝা সবচেয়ে গুরুত্বপূর্ণ।

যদিও পক্ষপাত দ্বারা উত্থাপিত চ্যালেঞ্জগুলি - সেগুলি ঐতিহাসিক, অ্যালগরিদমিক, বা ব্যবহারকারী-প্ররোচিত - তাৎপর্যপূর্ণ, সেগুলি অপ্রতিরোধ্য নয়৷ পক্ষপাতের উত্স এবং প্রকাশের উপর দৃঢ় উপলব্ধি সহ, আমরা তাদের মোকাবেলা করার জন্য আরও ভালভাবে সজ্জিত। যাইহোক, স্বীকৃতি এবং বোঝার শুধুমাত্র শুরু পয়েন্ট.

আমরা এই সিরিজে এগিয়ে যাওয়ার সাথে সাথে, আমাদের পরবর্তী ফোকাস আমাদের নিষ্পত্তিতে বাস্তব সরঞ্জাম এবং কাঠামোর উপর থাকবে। কিভাবে আমরা এআই মডেলগুলিতে পক্ষপাতের পরিমাণ পরিমাপ করব? এবং আরও গুরুত্বপূর্ণ, আমরা কীভাবে এর প্রভাব কমিয়ে আনব? এগুলি হল সেই গুরুত্বপূর্ণ প্রশ্নগুলি যা আমরা পরবর্তীতে অনুসন্ধান করব, এটি নিশ্চিত করে যে AI বিকশিত হতে থাকে, এটি এমন একটি দিক যা ন্যায্য এবং কার্যকরী উভয়ই হয়।

তথ্য সিন্থেটিক, কিন্তু আমাদের দল বাস্তব!

সিন্থোর সাথে যোগাযোগ করুন এবং আমাদের একজন বিশেষজ্ঞ আলোর গতিতে আপনার সাথে যোগাযোগ করবেন সিন্থেটিক ডেটার মান অন্বেষণ করতে!

সিনথেটিক ডেটা কি?

গুণমান নিশ্চিতকরণ প্রতিবেদন

SAS দ্বারা বাহ্যিক মূল্যায়ন

টাইম সিরিজ সিন্থেটিক ডেটা

PII স্ক্যানার

সিন্থেটিক মক ডেটা

ধারাবাহিক ম্যাপিং

ডি-আইডেন্টিফিকেশন এবং সংশ্লেষণ

নিয়ম-ভিত্তিক সিন্থেটিক ডেটা

সাবসেটিং

স্থাপনা এবং ইন্টিগ্রেশন

সংযোজকগুলির

বর্ধিত বৈশিষ্ট্য

সমর্থিত ডেটা

ব্যবহারকারী ডকুমেন্টেশন

একটি ডেমো তফসিল

প্রাইসিং

টেস্ট ডেটা

বৈশ্লেষিক ন্যায়

তথ্য আদান প্রদান

পণ্য ডেমো এর

ডেটা নগদীকরণ

স্বাস্থ্যসেবা

ফাইন্যান্স

পাবলিক সংস্থা

ব্যবহারকারী ডকুমেন্টেশন

শ্বেতপত্র এবং গাইড

ব্লগ

ওয়েবিনার

কেস স্টাডিজ

প্রাইসিং

আমাদের সম্পর্কে

কেরিয়ার

AI এর অদেখা অপরাধী: পক্ষপাতের ভিতর উন্মোচন করা

বায়াস ব্লগ সিরিজ: পার্ট 1

ভূমিকা

অ্যাকশনে পক্ষপাত: একটি বাস্তব-বিশ্বের উদাহরণ

বায়াস বোঝা

ন্যায্যতা সংজ্ঞায়িত করা

উত্স এবং প্রকারগুলি বোঝা

সর্বশেষ ভাবনা

তথ্য সিন্থেটিক, কিন্তু আমাদের দল বাস্তব!

প্রধান খাদ্যতালিকা

ন্যায্যতা সংজ্ঞায়িত করা