AI හි නොදුටු වැරදිකරු: ඇතුළත පක්ෂග්‍රාහීත්වය හෙළිදරව් කිරීම

Bias බ්ලොග් මාලාව: 1 කොටස

හැදින්වීම

වඩ වඩාත් කෘත්‍රිම බුද්ධිමය ක්‍රම ඇති අපගේ ලෝකයේ, සංකීර්ණ තීරණ ගැනීමේ වගකීම පැවරෙන යන්ත්‍ර වඩ වඩාත් ප්‍රචලිත වෙමින් පවතී. ව්‍යාපාර, ඉහළ කොටස් තීරණ ගැනීම සහ වෛද්‍ය අංශයේ පසුගිය වසර කිහිපය පුරාවට විවිධ වසම්වල AI භාවිතය පෙන්නුම් කරන සාහිත්‍යයක් වර්ධනය වෙමින් පවතී. කෙසේ වෙතත්, මෙම වර්ධනය වන ව්‍යාප්තියත් සමඟ, එම පද්ධතිවල ප්‍රවණතා ගැන මිනිසුන් දැක ඇත; එනම්, දත්තවල තනිකරම රටාවන් අනුගමනය කිරීම සඳහා නෛසර්ගිකව නිර්මාණය කර ඇති අතර, විවිධ ලිංගික හා වෙනස් කොට සැලකීමේ හැසිරීම් නිරීක්ෂණය කළ හැකි අර්ථයෙන් ඔවුන් අගතියේ සලකුණු පෙන්නුම් කර ඇත. මෑත කාලීන යුරෝපීය AI පනත, එවැනි අගතීන් පිළිබඳ කාරණය තරමක් පුළුල් ලෙස ආවරණය කරන අතර ඒ හා සම්බන්ධ ගැටළු විසඳීම සඳහා පදනමක් සකසයි. 

තාක්ෂණික ලියකියවිලි වසර පුරාවටම, ඇතැම් ජනවිකාස කෙරෙහි මෙම විකෘති හැසිරීම විස්තර කිරීමට මිනිසුන් "පක්ෂග්‍රාහී" යන යෙදුම භාවිතා කිරීමට නැඹුරු වී ඇත. අර්ථය වෙනස් වන, ව්‍යාකූලත්වය ඇති කරන සහ එය ආමන්ත්‍රණය කිරීමේ කාර්යය සංකීර්ණ කරන වචනයකි.

මෙම ලිපිය පක්ෂග්‍රාහී මාතෘකාව ආවරණය වන බ්ලොග් සටහන් මාලාවක පළමු ලිපියයි. මෙම ලිපි මාලාවේදී, අපි ඔබට AI හි පක්ෂග්‍රාහීත්වය පිළිබඳ පැහැදිලි, ජීර්ණය කළ හැකි අවබෝධයක් ලබා දීමට ඉලක්ක කරමු. අපි පක්ෂග්‍රාහීත්වය මැනීමට සහ අවම කිරීමට ක්‍රම හඳුන්වා දෙන්නෙමු සහ වඩාත් සාධාරණ පද්ධති සඳහා මෙම මාවතේ කෘතිම දත්තවල කාර්යභාරය ගවේෂණය කරන්නෙමු. කෘත්‍රිම දත්ත උත්පාදනයේ ප්‍රමුඛතම ක්‍රීඩකයෙකු වන Syntho මෙම ප්‍රයත්නයට දායක විය හැකි ආකාරය පිළිබඳව ද අපි ඔබට එබිකම් කරන්නෙමු. එබැවින්, ඔබ ක්‍රියාකාරී තීක්ෂ්ණ බුද්ධියක් සොයන වෘත්තිකයෙකු වුවද හෝ මෙම මාතෘකාව ගැන කුතුහලයෙන් සිටියද, ඔබ සිටින්නේ නිවැරදි ස්ථානයේය.

ක්‍රියාකාරීත්වයේ පක්ෂග්‍රාහීත්වය: සැබෑ ලෝක උදාහරණයක්

"AI හි මෙම පක්ෂග්‍රාහී වීම වැදගත් ය, නමුත් මට, සාමාන්‍ය මිනිසුන්ට එයින් අදහස් කරන්නේ කුමක්ද?" ඔබ කල්පනා කරනවා විය හැකිය. සත්යය නම්, බලපෑම දුරදිග යන, බොහෝ විට නොපෙනෙන නමුත් ප්රබල වේ. AI හි පක්ෂග්‍රාහීත්වය හුදු ශාස්ත්‍රීය සංකල්පයක් නොවේ; එය බරපතල ප්‍රතිවිපාක සහිත සැබෑ ලෝක ගැටලුවකි.

උදාහරණයක් ලෙස ලන්දේසි ළමා සුභසාධන සෝලිය ගන්න. අවම මානව මැදිහත්වීමකින් සාධාරණ හා කාර්යක්ෂම ප්‍රතිඵල ජනනය කිරීම සඳහා නිර්මාණය කරන ලද මෙවලමක් යැයි කියනු ලබන ස්වයංක්‍රීය පද්ධතිය පක්ෂග්‍රාහී විය. එය දෝෂ සහිත දත්ත සහ උපකල්පන මත පදනම්ව වංචා කිරීම සඳහා දෙමාපියන් දහස් ගණනක් වැරදි ලෙස සලකුණු කළේය. ප්රතිඵලය? AI පද්ධතියක ඇති පක්ෂග්‍රාහීත්වය හේතුවෙන් කැලඹීමට ලක් වූ පවුල්, පුද්ගලික කීර්තිනාමයට හානි, සහ මූල්‍ය දුෂ්කරතා. AI හි පක්ෂග්‍රාහීත්වය ආමන්ත්‍රණය කිරීමේ හදිසි අවශ්‍යතාවය ඉස්මතු කරන්නේ මෙවැනි උදාහරණ වේ.

ජනතාව විරෝධතා

නමුත් අපි එතනින් නවතින්න එපා. මෙම සිදුවීම පක්ෂග්‍රාහී විනාශයක් සිදු කරන හුදකලා සිද්ධියක් නොවේ. AI හි පක්ෂග්‍රාහී බලපෑම අපගේ ජීවිතයේ සෑම කොනකටම විහිදේ. රැකියාවක් සඳහා කුලියට ගන්නේ කවුරුන්ද, ණයක් සඳහා අනුමැතිය ලබා ගන්නේ කවුරුන්ද, කුමන ආකාරයේ වෛද්‍ය ප්‍රතිකාර ලබා ගන්නේද යන්න දක්වා - පක්ෂග්‍රාහී AI පද්ධති පවතින අසමානතාවයන් පවත්වා ගෙන ගොස් නව ඒවා නිර්මාණය කළ හැකිය.

මෙය සලකා බලන්න: පක්ෂග්‍රාහී ඓතිහාසික දත්ත මත පුහුණු කරන ලද AI පද්ධතියක් හොඳ සුදුසුකම් ලත් අපේක්ෂකයෙකුට ඔවුන්ගේ ස්ත්‍රී පුරුෂ භාවය හෝ වාර්ගිකත්වය නිසා රැකියාවක් ප්‍රතික්ෂේප කළ හැකිය. නැතහොත් පක්ෂග්‍රාහී AI පද්ධතියක් සුදුසුකම් ලත් අපේක්ෂකයෙකුට ඔවුන්ගේ තැපැල් කේතය නිසා ණයක් ප්‍රතික්ෂේප කළ හැකිය. මේවා හුදෙක් උපකල්පිත අවස්ථා නොවේ; ඒවා දැන් සිදුවෙමින් පවතී.

ඓතිහාසික නැඹුරුව සහ මිනුම් නැඹුරුව වැනි විශේෂිත පක්ෂග්‍රාහී වර්ග එවැනි දෝෂ සහිත තීරණ වලට තුඩු දෙයි. ඒවා දත්ත වලට ආවේනික වන අතර, සමාජීය පක්ෂග්‍රාහීත්වයන් තුල ගැඹුරින් මුල් බැස ඇති අතර විවිධ ජනවිකාස කණ්ඩායම් අතර අසමාන ප්‍රතිඵල වලින් පිලිබිඹු වේ. ඔවුන්ට පුරෝකථන ආකෘතිවල තීරණ වෙනස් කළ හැකි අතර අසාධාරණ සැලකීමට හේතු වේ.

මහා පරිමාණයෙන්, AI හි පක්ෂග්‍රාහීත්වයට නිහඬ බලපෑම් කරන්නෙකු ලෙස ක්‍රියා කළ හැකි අතර, අපගේ සමාජය සහ අපගේ ජීවිත සූක්ෂ්ම ලෙස හැඩගස්වනු ලබයි, බොහෝ විට අපට පවා නොදැනෙන ආකාරයෙන්. ඉහත සඳහන් කළ කරුණු සියල්ල නැවැත්වීමට පියවර නොගත්තේ මන්දැයි සහ එය කළ හැකිද යන ප්‍රශ්නයට ඔබව යොමු කළ හැකිය.

ඇත්ත වශයෙන්ම, නව තාක්‍ෂණික දියුණුවත් සමඟ එවැනි ගැටලුවක් විසඳීමට වැඩි වැඩියෙන් ප්‍රවේශ විය හැකිය. කෙසේ වෙතත්, මෙම ගැටලුව විසඳීමේ පළමු පියවර වන්නේ එහි පැවැත්ම සහ බලපෑම අවබෝධ කර ගැනීම සහ පිළිගැනීමයි. දැනට, එහි පැවැත්ම පිළිබඳ පිළිගැනීමක් නිර්මාණය වී ඇති අතර, "අවබෝධය" යන කාරණය තවමත් තරමක් අපැහැදිලි වේ. 

පක්ෂග්රාහීත්වය අවබෝධ කර ගැනීම

විසින් ඉදිරිපත් කරන ලද පක්ෂග්‍රාහී මුල් නිර්වචනය අතරතුර කේම්බ්‍රිජ් ශබ්දකෝෂය එය AI හා සම්බන්ධ වන බැවින් වචනයේ ප්‍රධාන අරමුණෙන් බොහෝ දුරස් නොවේ, මෙම ඒකීය නිර්වචනයට පවා විවිධ අර්ථකථනයන් කළ යුතුය. වැනි පර්යේෂකයන් විසින් ඉදිරිපත් කරන ලද වර්ගීකරණයන් Hellström et al (2020) සහ ක්ලීග්ර් (2021), පක්ෂග්‍රාහී නිර්වචනය පිළිබඳ ගැඹුරු අවබෝධයක් ලබා දෙන්න. කෙසේ වෙතත්, මෙම ලිපි ලේඛන දෙස සරල බැල්මක් හෙලිදරව් වනු ඇත, කෙසේ වෙතත්, ගැටලුව ඵලදායී ලෙස විසඳීම සඳහා යෙදුමේ අර්ථ දැක්වීමේ විශාල පටුවීමක් අවශ්ය වේ. 

සිදුවීම්වල වෙනසක් වන අතර, පක්ෂග්‍රාහී අර්ථය ප්‍රශස්ත ලෙස අර්ථ දැක්වීමට සහ ප්‍රකාශ කිරීමට කෙනෙකුට ප්‍රතිවිරුද්ධ දෙය වඩා හොඳින් අර්ථ දැක්විය හැකිය, එනම් සාධාරණත්වය. 

සාධාරණත්වය නිර්වචනය කිරීම 

වැනි විවිධ මෑත සාහිත්‍යවල එය අර්ථ දක්වා ඇත Castelnovo et al. (2022), විභව අවකාශය යන පදය පිළිබඳ අවබෝධයක් ලබා දීමෙන් සාධාරණත්වය විස්තාරණය කළ හැකිය. එය පවතින පරිදි, විභව අවකාශය (PS) යනු යම් ජනවිකාස කණ්ඩායමකට අයත් වුවද පුද්ගලයෙකුගේ හැකියාවන් සහ දැනුමේ ප්‍රමාණයයි. PS සංකල්පයේ මෙම නිර්වචනය අනුව, කෙනෙකුට පක්ෂග්‍රාහී ප්‍රේරක පරාමිතීන්හි (වර්ගය, වයස හෝ ස්ත්‍රී පුරුෂ භාවය වැනි) නිරීක්ෂණය කළ හැකි සහ සැඟවුණු වෙනස්කම් නොතකා, සමාන PS ඇති පුද්ගලයන් දෙදෙනෙකු අතර සැලකීමේ සමානාත්මතාවය සාධාරණත්වය ලෙස පහසුවෙන් අර්ථ දැක්විය හැක. මෙම නිර්වචනයෙන් ඕනෑම අපගමනය, සමානාත්මතාවයේ අවස්ථා ලෙසද හැඳින්වේ, එය පක්ෂග්‍රාහීත්වය පිළිබඳ පැහැදිලි ඇඟවීමක් වන අතර වැඩිදුර විමර්ශනයට යෝග්‍ය වේ.  

අපගේ ලෝකයේ පවතින ආවේනික පක්ෂග්‍රාහීත්වය අනුව මෙහි නිර්වචනය කර ඇති පරිදි යමක් සාක්ෂාත් කර ගැනීම සම්පූර්ණයෙන්ම කළ නොහැක්කක් විය හැකි බව පාඨකයින් අතර සිටින වෘත්තිකයන්ට පෙනෙනු ඇත. ඒක ඇත්ත! අප ජීවත් වන ලෝකය, මේ ලෝකයේ සිදුවීම් වලින් එකතු කරන ලද සියලුම දත්ත සමඟ, බොහෝ ඓතිහාසික හා සංඛ්‍යානමය පක්ෂග්‍රාහීත්වයට යටත් වේ. මෙය ඇත්ත වශයෙන්ම, එවැනි "පක්ෂග්‍රාහී" දත්ත මත පුහුණු කරන ලද පුරෝකථන ආකෘති මත පක්ෂග්‍රාහී බලපෑම් සම්පූර්ණයෙන්ම අවම කිරීම පිළිබඳ විශ්වාසය අඩු කරයි. කෙසේ වෙතත්, විවිධ ක්රම භාවිතයෙන්, පක්ෂග්රාහී බලපෑම් අවම කිරීමට උත්සාහ කළ හැකිය. මෙය එසේ වූ විට, මෙම බ්ලොග් සටහනේ (ය) ඉතිරි කොටසෙහි භාවිතා වන පාරිභාෂිතය පක්ෂග්‍රාහී බලපෑම සම්පූර්ණයෙන්ම අවම කිරීමට වඩා අවම කිරීමේ අදහස දෙසට මාරු වනු ඇත.

හරි හරී! එබැවින් දැන් පක්ෂග්රාහීත්වය යනු කුමක්ද සහ එහි පැවැත්ම තක්සේරු කළ හැක්කේ කෙසේද යන්න පිළිබඳ අදහසක් ඉදිරිපත් කර ඇත; කෙසේ වෙතත්, අපට ගැටලුව නිවැරදිව විසඳීමට අවශ්‍ය නම්, මෙම සියලු පක්ෂග්‍රාහීකම් ආරම්භ වන්නේ කොතැනින්දැයි අප දැනගත යුතුය.

මූලාශ්ර සහ වර්ග තේරුම් ගැනීම

පවතින පර්යේෂණ යන්ත්‍ර ඉගෙනීමේ විවිධ ආකාරයේ පක්ෂග්‍රාහීත්වයන් පිළිබඳ වටිනා අවබෝධයක් සපයයි. පරිදි Mehrabi et. අල්. (2019) යන්ත්‍ර ඉගෙනීමේදී පක්ෂග්‍රාහීව බෙදීමට කටයුතු කර ඇත, කෙනෙකුට පක්ෂග්‍රාහී ප්‍රධාන වර්ග 3කට බෙදිය හැකිය. එනම්:

  • ඇල්ගොරිතමයට දත්ත: දත්ත වලින්ම හටගන්නා පක්ෂග්‍රාහී වර්ගීකරණයකි. එය දුර්වල දත්ත රැස්කිරීම, ලෝකයේ පවතින ආවේනික පක්ෂග්‍රාහීත්වය ආදිය නිසා ඇති විය හැක.
  • පරිශීලකයාට ඇල්ගොරිතම: ඇල්ගොරිතමවල සැලසුම් සහ ක්‍රියාකාරීත්වය මත පැන නගින පක්ෂග්‍රාහී ප්‍රවර්ගයක්. ඇල්ගොරිතම මගින් පක්ෂග්‍රාහී ප්‍රතිඵලවලට තුඩු දිය හැකි, අන්‍යයන්ට වඩා ඇතැම් දත්ත ලක්ෂ්‍යයන් අර්ථකථනය කරන, කිරා මැන බලන ආකාරය හෝ සලකා බලන ආකාරය එයට ඇතුළත් වේ.
  • පරිශීලක දත්ත: පද්ධතිය සමඟ පරිශීලක අන්තර්ක්‍රියා වලින් පැන නගින පක්ෂග්‍රාහීත්වයට අදාළ වේ. පරිශීලකයන් දත්ත ඇතුළත් කරන ආකාරය, ඔවුන්ගේ ආවේනික පක්ෂග්‍රාහීත්වය හෝ පද්ධති ප්‍රතිදානයන් කෙරෙහි ඔවුන්ගේ විශ්වාසය පවා ප්‍රතිඵලවලට බලපෑම් කළ හැකිය.
ප්රස්ථාරය

රූපය 1: දත්ත කැණීම සඳහා CRISP-DM රාමුවේ දෘශ්‍යකරණය; දත්ත කැණීමේදී බහුලව භාවිතා වන අතර පක්ෂග්‍රාහීත්වය ඇති විය හැකි අවධීන් හඳුනා ගැනීමේ ක්‍රියාවලියට අදාළ වේ.

නම් මගින් පක්ෂග්‍රාහී ස්වරූපය පෙන්නුම් කරන අතර, කෙනෙකුට මෙම කුඩ නියමයන් යටතේ වර්ගීකරණය කළ හැකි පක්ෂග්‍රාහී වර්ග පිළිබඳව තවමත් ප්‍රශ්න තිබිය හැකිය. අපගේ පාඨකයන් අතර උද්යෝගිමත් අය සඳහා, අපි මෙම පාරිභාෂිතය සහ වර්ගීකරණයට අදාළ සමහර සාහිත්‍ය වෙත සබැඳි සපයා ඇත. මෙම බ්ලොග් සටහනේ සරල බව සඳහා, අපි තත්වයට අදාළ තෝරාගත් පක්ෂග්‍රාහී කිහිපයක් ආවරණය කරන්නෙමු (ඒවා සියල්ලම පාහේ ඇල්ගොරිතමයට ප්‍රවර්ග දත්ත වේ). විශේෂිත පක්ෂග්‍රාහී වර්ග පහත පරිදි වේ:

  • ඓතිහාසික පක්ෂග්‍රාහීත්වය: විවිධ සමාජ කණ්ඩායම් සහ පොදුවේ සමාජය තුළ ලෝකයේ පවතින ස්වභාවික පක්ෂග්‍රාහීත්වය නිසා ඇති වන දත්ත වලට ආවේණික වූ පක්ෂග්‍රාහී වර්ගයකි. නියැදීමේ සහ විශේෂාංග තේරීමේ විවිධ ක්‍රම මගින් එය අවම කළ නොහැකි වන්නේ ලෝකයේ මෙම දත්තවල නෛසර්ගිකත්වය නිසාය.
  • මිනුම් නැඹුරුව සහ නියෝජන පක්ෂග්‍රාහීත්වය: දත්ත කට්ටලයේ විවිධ උප සමූහවල “හිතකර” ප්‍රතිඵලවල අසමාන ප්‍රමාණයන් අඩංගු වන විට මෙම සමීපව සම්බන්ධ පක්ෂග්‍රාහීකම් දෙක සිදු වේ. එබැවින් මෙම ආකාරයේ පක්ෂග්‍රාහීත්වය පුරෝකථන ආකෘතිවල ප්‍රතිඵලය විකෘති කළ හැකිය
  • ඇල්ගොරිතම නැඹුරුව: භාවිතයේ ඇති ඇල්ගොරිතමයට සම්පූර්ණයෙන්ම සම්බන්ධ නැඹුරුව. පරීක්ෂණ වලදී නිරීක්ෂණය කරන ලද පරිදි (පසුකරයේ තවදුරටත් විස්තර කර ඇත), මෙම වර්ගයේ පක්ෂග්‍රාහී ඇල්ගොරිතමයක සාධාරණත්වය කෙරෙහි විශාල බලපෑමක් ඇති කළ හැකිය.

යන්ත්‍ර ඉගෙනීමේ පක්ෂග්‍රාහීත්වය පිළිබඳ මෙම මූලික අවබෝධයන් පසුව පළ කිරීම් වලදී ගැටලුව වඩාත් ඵලදායී ලෙස විසඳීම සඳහා භාවිතා කරනු ඇත.

සමාප්ති අදහස්

කෘත්‍රිම බුද්ධිය තුළ ඇති පක්ෂග්‍රාහීත්වය පිළිබඳ මෙම ගවේෂණයේ දී, අපගේ වැඩි වැඩියෙන් AI- ධාවනය වන ලෝකය තුළ එය ඇති කරන ගැඹුරු ඇඟවුම් අපි ආලෝකමත් කර ඇත්තෙමු. ලන්දේසි ළමා සුභසාධන සෝලිය වැනි සැබෑ ලෝක උදාහරණවල සිට පක්ෂග්‍රාහී කාණ්ඩ සහ වර්ගවල සංකීර්ණ සූක්ෂ්මතා දක්වා, පක්ෂග්‍රාහීත්වය හඳුනා ගැනීම සහ තේරුම් ගැනීම ඉතා වැදගත් බව පැහැදිලිය.

පක්ෂග්‍රාහීත්වය විසින් එල්ල කරන ලද අභියෝග - ඒවා ඓතිහාසික, ඇල්ගොරිතම හෝ පරිශීලක-ප්‍රේරිත වුවත් - සැලකිය යුතු වුවත්, ඒවා ජයගත නොහැකි ඒවා නොවේ. පක්ෂග්‍රාහීත්වයේ මූලාරම්භය සහ ප්‍රකාශනයන් පිළිබඳව දැඩි ග්‍රහණයක් සහිතව, අපි ඒවා ආමන්ත්‍රණය කිරීමට වඩා හොඳින් සන්නද්ධව සිටිමු. කෙසේ වෙතත්, පිළිගැනීම සහ අවබෝධය ආරම්භක ලක්ෂ්යයන් පමණි.

අපි මෙම ලිපි මාලාවේ ඉදිරියට යන විට, අපගේ මීළඟ අවධානය යොමු වන්නේ අප සතුව ඇති ස්පර්ශ්‍ය මෙවලම් සහ රාමු වෙතය. AI මාදිලිවල පක්ෂග්‍රාහී ප්‍රමාණය අපි මනින්නේ කෙසේද? සහ වඩාත් වැදගත් වන්නේ, අපි එහි බලපෑම අවම කරන්නේ කෙසේද? AI අඛණ්ඩව පරිණාමය වන විට, එය සාධාරණ හා ක්‍රියාකාරී වන දිශාවකට එය සිදු කරන බව සහතික කරමින්, අපි මීළඟට විමසා බලන දැවෙන ප්‍රශ්න මේවාය.

සිනාසෙන පිරිසක්

දත්ත සින්තටික්, නමුත් අපගේ කණ්ඩායම සැබෑ ය!

සින්තෝ අමතන්න කෘතිම දත්තවල වටිනාකම ගවේෂණය කිරීම සඳහා අපගේ විශේෂඥයෙකු ආලෝකයේ වේගයෙන් ඔබ හා සම්බන්ධ වනු ඇත!