Sun'iy intellektning ko'rinmas aybdori: ichidagi noto'g'rilikni ochish

Bias blog seriyasi: 1-qism

Kirish

Sun'iy intellekt shakllari tobora ortib borayotgan dunyomizda murakkab qarorlar qabul qilish vazifasi yuklatilgan mashinalar tobora kengayib bormoqda. Ishbilarmonlik, muhim qarorlarni qabul qilish kabi turli sohalarda va so'nggi bir necha yil ichida tibbiyot sohasida sun'iy intellektdan foydalanishni ko'rsatadigan adabiyotlar soni ortib bormoqda. Biroq, bu o'sib borayotgan tarqalish bilan, odamlar ushbu tizimlardagi tendentsiyalarga e'tibor berishdi; Ya'ni, tabiatan ma'lumotlardagi naqshlarga amal qilish uchun yaratilgan bo'lsa-da, ular turli xil jinsiy va kamsituvchi xatti-harakatlar kuzatilishi mumkin bo'lgan noto'g'ri qarashlarni ko'rsatdi. Yaqinda Evropa AI qonuni, shuningdek, bunday noto'g'ri qarashlar masalasini juda keng yoritadi va u bilan bog'liq muammolarni hal qilish uchun asos yaratadi.

Texnik hujjatlar yillari davomida odamlar ma'lum demografik ma'lumotlarga nisbatan bunday noto'g'ri xatti-harakat turini tasvirlash uchun "noto'g'rilik" atamasidan foydalanishga moyil bo'lishdi; ma'nosi turlicha bo'lgan, chalkashliklarni keltirib chiqaradigan va unga murojaat qilish vazifasini murakkablashtiradigan so'z.

Ushbu maqola tarafkashlik mavzusini yorituvchi blog postlari seriyasining birinchisidir. Ushbu seriyada biz sizga sun'iy intellektdagi tarafkashlik haqida aniq va tushunarli tushuncha berishni maqsad qilganmiz. Biz noto'g'rilikni o'lchash va minimallashtirish usullarini tanishtiramiz va yanada adolatli tizimlar uchun bu yo'lda sintetik ma'lumotlarning rolini o'rganamiz. Sintetik maʼlumotlarni ishlab chiqarish boʻyicha yetakchi oʻyinchi boʻlgan Syntho ushbu saʼy-harakatlarga qanday hissa qoʻshishi haqida ham sizga maʼlumot beramiz. Shunday qilib, siz amaliyotchi bo'lasizmi yoki amaliy tushunchalarni qidiryapsizmi yoki ushbu mavzuga qiziqasizmi, siz to'g'ri joydasiz.

Faoliyatdagi tarafkashlik: haqiqiy dunyo misoli

Siz hayron bo'layotgandirsiz: "Intellektual intellektdagi bu tarafkashlik juda muhim, ammo bu men uchun, oddiy odamlar uchun nimani anglatadi?" Haqiqat shundaki, ta'sir keng qamrovli, ko'pincha ko'rinmas, ammo kuchli. AIda tarafkashlik oddiy ilmiy tushuncha emas; bu jiddiy oqibatlarga olib keladigan haqiqiy muammo.

Misol tariqasida Gollandiyadagi bolalar farovonligi mojarosini olaylik. Avtomatlashtirilgan tizim, go'yoki insonning minimal aralashuvi bilan adolatli va samarali natijalarni yaratish uchun yaratilgan vosita, bir tomonlama edi. Bu noto'g'ri ma'lumotlar va taxminlarga asoslanib, minglab ota-onalarni firibgarlikda aybladi. Natija? AI tizimidagi noto'g'ri munosabat tufayli oilalar tartibsizliklarga duchor bo'ldi, shaxsiy obro'siga putur etkazildi va moliyaviy qiyinchiliklar. Aynan shunga o'xshash misollar sun'iy intellektdagi tarafkashlikni bartaraf etishning dolzarbligini ta'kidlaydi.

Manba: "2030 yilgacha tovon puli to'lanadi”, 2023. AQSh

Ammo bu bilan to'xtab qolmaylik. Bu hodisa vayronagarchilikni keltirib chiqaradigan yolg'iz holat emas. AIdagi tarafkashlikning ta'siri hayotimizning barcha burchaklariga ta'sir qiladi. Kim ishga yollanadi, kim kreditga rozi bo'ladi, kim qanday tibbiy muolaja oladi - noxolis AI tizimlari mavjud tengsizliklarni davom ettirishi va yangilarini yaratishi mumkin.

Buni o'ylab ko'ring: noxolis tarixiy ma'lumotlarga asoslangan sun'iy intellekt tizimi yaxshi malakali nomzodni jinsi yoki etnik kelib chiqishi tufayli ishdan bo'shatishi mumkin. Yoki noxolis AI tizimi munosib nomzodga pochta indeksi tufayli kredit berishni rad qilishi mumkin. Bu faqat taxminiy stsenariylar emas; ular hozir sodir bo'lmoqda.

Tarixiy tarafkashlik va o'lchov tarafkashligi kabi noto'g'ri qarashlarning o'ziga xos turlari bunday noto'g'ri qarorlarga olib keladi. Ular ma'lumotlarga xos bo'lib, jamiyatdagi qarama-qarshiliklarda chuqur ildiz otgan va turli demografik guruhlar o'rtasidagi teng bo'lmagan natijalarda aks etadi. Ular bashoratli modellarning qarorlarini buzishi va adolatsiz munosabatga olib kelishi mumkin.

Katta sxema bo'yicha, sun'iy intellektdagi tarafkashlik jamiyatimiz va hayotimizni nozik tarzda shakllantirib, jimgina ta'sir o'tkazuvchi rolini o'ynashi mumkin, ko'pincha biz buni sezmaymiz. Yuqorida aytib o'tilgan barcha fikrlar sizni nima uchun to'xtatish choralari ko'rilmagani va buning iloji bormi degan savolga olib kelishi mumkin.

Darhaqiqat, yangi texnologik yutuqlar bilan bunday muammoni hal qilish yanada qulayroq bo'ladi. Biroq, bu muammoni hal qilishning birinchi qadami uning mavjudligi va ta'sirini tushunish va tan olishdir. Hozircha "tushunish" masalasi haligacha noaniq bo'lib qolib, uning mavjudligini tan olish yaratilgan.

Tarafsizlikni tushunish

tomonidan taqdim etilgan tarafkashlikning asl ta'rifi Kembrij lug'ati so'zning asosiy maqsadidan uzoqlashmaydi, chunki u AI bilan bog'liq bo'lsa, hatto bu yagona ta'rifga ham juda ko'p turli xil talqin qilish kerak. kabi tadqiqotchilar tomonidan taqdim etilgan taksonomiyalar Hellström va boshqalar (2020) va Kliegr (2021), tarafkashlikning ta'rifi haqida chuqurroq ma'lumot beradi. Biroq, ushbu hujjatlarga oddiy qarash, muammoni samarali hal qilish uchun atama ta'rifini sezilarli darajada qisqartirish kerakligini ko'rsatadi.

Voqealarning o'zgarishi bo'lsa-da, tarafkashlikning ma'nosini optimal tarzda aniqlash va etkazish uchun buning aksini, ya'ni adolatni yaxshiroq aniqlash mumkin.

Adolatni aniqlash 

Kabi turli so'nggi adabiyotlarda ta'riflanganidek Castelnovo va boshqalar. (2022), adolatlilik potentsial makon atamasini tushungan holda ishlab chiqilishi mumkin. Mavjud bo'lganidek, potentsial makon (PS) ma'lum bir demografik guruhga mansubligidan qat'i nazar, shaxsning qobiliyatlari va bilimlari darajasini anglatadi. PS kontseptsiyasining ushbu ta'rifini hisobga oladigan bo'lsak, adolatni osonlikcha teng PSga ega bo'lgan ikki shaxs o'rtasidagi munosabatlarning tengligi, ular tarafkashlikni keltirib chiqaradigan parametrlarda (masalan, irq, yosh yoki jins) kuzatilishi mumkin bo'lgan va yashirin farqlaridan qat'i nazar, aniqlanishi mumkin. Imkoniyatlar tengligi deb ham ataladigan ushbu ta'rifdan har qanday chalg'itish tarafkashlikning yaqqol ko'rsatkichidir va keyingi tekshirishga loyiqdir.

O'quvchilar orasidagi amaliyotchilar, bizning dunyomizda mavjud bo'lgan o'ziga xos tomonlarni hisobga olgan holda, bu erda ta'riflangan narsaga erishish mutlaqo mumkin emasligini payqashlari mumkin. Bu haqiqat! Biz yashayotgan dunyo, bu dunyodagi hodisalardan to'plangan barcha ma'lumotlar bilan bir qatorda, juda ko'p tarixiy va statistik tarafkashliklarga duchor bo'ladi. Bu, haqiqatan ham, bunday "noxolis" ma'lumotlar bo'yicha o'qitilgan bashoratli modellarga noto'g'ri munosabatning ta'sirini to'liq yumshatishga ishonchni pasaytiradi. Biroq, turli usullarni qo'llash orqali tarafkashlikning ta'sirini minimallashtirishga harakat qilish mumkin. Shunday bo'lsa, ushbu blog post(lar)ining qolgan qismida qo'llanilgan terminologiya tarafkashlikning ta'sirini to'liq yumshatish o'rniga uni minimallashtirish g'oyasiga o'tadi.

Xop! Endi tarafkashlik nima ekanligi va uning mavjudligini qanday baholash mumkinligi haqida fikr ilgari surildi; Agar biz muammoni to'g'ri hal qilmoqchi bo'lsak, bu noto'g'ri fikrlar qaerdan kelib chiqqanligini bilishimiz kerak.

Manbalar va turlarini tushunish

Mavjud tadqiqotlar mashinani o'rganishdagi har xil turdagi noto'g'ri tushunchalar haqida qimmatli ma'lumotlarni beradi. Sifatida Mehrabi va boshqalar. al. (2019) Mashinani o'rganishda tarafkashliklarni ajratishga kirishgan bo'lsak, ularni 3 ta asosiy toifaga bo'lish mumkin. Ya'ni:

Algoritmga ma'lumotlar: ma'lumotlarning o'zidan kelib chiqadigan qarama-qarshiliklarni o'z ichiga olgan kategoriya. Bu noto'g'ri ma'lumotlar to'plash, dunyoda mavjud bo'lgan o'ziga xos noto'g'ri qarashlar va boshqalar tufayli yuzaga kelishi mumkin.
Algoritmdan foydalanuvchiga: algoritmlarning dizayni va funksionalligidan kelib chiqadigan noto'g'ri fikrlarga qaratilgan kategoriya. U algoritmlarning ma'lum ma'lumotlar nuqtalarini boshqalarga nisbatan qanday izohlashi, tortishi yoki ko'rib chiqishini o'z ichiga oladi, bu esa noxolis natijalarga olib kelishi mumkin.
Foydalanuvchidan ma'lumotlarga: foydalanuvchining tizim bilan o'zaro ta'siridan kelib chiqadigan noto'g'ri fikrlarga tegishli. Foydalanuvchilarning ma'lumotlarni kiritish usuli, ularning o'ziga xos noto'g'riligi yoki hatto tizim natijalariga bo'lgan ishonchi natijalarga ta'sir qilishi mumkin.

1-rasm: Ma'lumotlarni qazib olish uchun CRISP-DM ramkasining vizualizatsiyasi; odatda ma'lumotlarni qazib olishda qo'llaniladi va tarafkashlik yuzaga kelishi mumkin bo'lgan bosqichlarni aniqlash jarayoniga tegishli.

Ismlar tarafkashlik shaklini ko'rsatsa-da, ushbu soyabon atamalar ostida tasniflash mumkin bo'lgan noto'g'ri tushunchalar turlari haqida hali ham savollar tug'ilishi mumkin. O'quvchilarimiz orasida ishqibozlar uchun biz ushbu atama va tasnifga oid ba'zi adabiyotlarga havolalarni taqdim etdik. Ushbu blog postida soddalik uchun biz vaziyatga tegishli bo'lgan bir nechta tanlangan noto'g'ri fikrlarni ko'rib chiqamiz (ularning deyarli barchasi toifadagi ma'lumotlar algoritmiga tegishli). Noto'g'rilikning o'ziga xos turlari quyidagilardan iborat:

Tarixiy tarafkashlik: turli ijtimoiy guruhlarda va umuman jamiyatda dunyoda mavjud bo'lgan tabiiy qarama-qarshiliklardan kelib chiqadigan ma'lumotlarga xos bo'lgan bir xil. Ushbu ma'lumotlarning dunyoga xosligi tufayli uni turli xil namunalar va xususiyatlarni tanlash vositalari orqali yumshatib bo'lmaydi.
O'lchov tarafkashligi va vakillik noto'g'riligi: Bu ikki chambarchas bog'liq noto'g'ri ma'lumotlar to'plamining turli kichik guruhlarida teng bo'lmagan miqdordagi "qulay" natijalar mavjud bo'lganda yuzaga keladi. Shuning uchun bunday noto'g'ri yondashuv bashoratli modellarning natijalarini buzishi mumkin
Algoritmik tarafkashlik: faqat foydalanilayotgan algoritmga bog'liq bo'lgan tarafkashlik. O'tkazilgan testlarda ham kuzatilganidek (postda batafsilroq bayon qilingan), bunday noto'g'ri munosabat berilgan algoritmning adolatliligiga katta ta'sir ko'rsatishi mumkin.

Mashinalarni o'rganishda tarafkashlik haqidagi ushbu asosiy tushunchalar keyingi postlarda muammoni yanada samarali hal qilish uchun qo'llaniladi.

final Fikrlar

Sun'iy intellektdagi tarafkashlikni o'rganishda biz uning tobora ortib borayotgan sun'iy intellekt dunyomizdagi chuqur ta'sirini yoritib berdik. Gollandiyadagi bolalar farovonligi janjali kabi haqiqiy misollardan tortib, toifalar va turlarning murakkab nuanslarigacha, tarafkashlikni tan olish va tushunish eng muhimi ekanligi ayon bo'ladi.

Garchi noto'g'ri qarashlar keltirib chiqaradigan qiyinchiliklar - ular tarixiy, algoritmik yoki foydalanuvchi tomonidan qo'zg'atilgan bo'ladimi - muhim bo'lsa-da, ularni engib bo'lmaydi. Qarama-qarshilikning kelib chiqishi va namoyon bo'lishini qat'iy tushungan holda, biz ularni hal qilish uchun ko'proq tayyormiz. Biroq, tan olish va tushunish faqat boshlang'ich nuqtadir.

Ushbu ketma-ketlikda oldinga siljiganimizda, bizning keyingi e'tiborimiz bizning ixtiyorimizdagi aniq vositalar va ramkalarga qaratiladi. AI modellarida tarafkashlik darajasini qanday o'lchaymiz? Va eng muhimi, uning ta'sirini qanday kamaytirish mumkin? Bular biz keyingi muhokama qiladigan dolzarb savollar bo‘lib, AI rivojlanishda davom etar ekan, u buni adolatli va samarali yo‘nalishda amalga oshirishini ta’minlaydi.

Ma'lumotlar sintetik, ammo bizning jamoamiz haqiqiy!

Syntho bilan bog'laning va bizning mutaxassislarimizdan biri sintetik ma'lumotlarning qiymatini o'rganish uchun yorug'lik tezligida siz bilan bog'lanadi!

Sintetik ma'lumotlar nima?

Sifat kafolati hisoboti

SAS tomonidan tashqi baholash

Vaqt seriyasining sintetik ma'lumotlari

PII skaneri

Sintetik soxta ma'lumotlar

Doimiy xaritalash

Deidentifikatsiya va sintez

Qoidalarga asoslangan sintetik ma'lumotlar

Subsetting

Joylashtirish va integratsiya

Aloqa xodimlari

Kengaytirilgan xususiyatlar

Qo'llab-quvvatlanadigan ma'lumotlar

Foydalanuvchi hujjatlari

Namoyishni rejalashtiring

narxlanish

Sinov ma'lumotlari

Tahlillar

Ma'lumot almashish

Mahsulot demosi

Ma'lumotlarni monetizatsiya qilish

Sog'liqni saqlash

Moliya

Jamoat tashkilotlari

Foydalanuvchi hujjatlari

Oq qog'ozlar va qo'llanmalar

Blog

Webinars

Case tadqiqotlar

narxlanish

Biz Haqimizda

Martaba

Sun'iy intellektning ko'rinmas aybdori: ichidagi noto'g'rilikni ochish

Bias blog seriyasi: 1-qism

Kirish

Faoliyatdagi tarafkashlik: haqiqiy dunyo misoli

Tarafsizlikni tushunish

Adolatni aniqlash

Manbalar va turlarini tushunish

final Fikrlar

Ma'lumotlar sintetik, ammo bizning jamoamiz haqiqiy!

Asosiy menyu

Adolatni aniqlash