Fajtori i paparë i AI: Zbulimi i paragjykimeve brenda

Seria e blogut të paragjykimit: pjesa 1

Prezantimi

Në botën tonë të formave gjithnjë e më artificiale të inteligjencës, makinat që kanë për detyrë të marrin vendime komplekse po bëhen gjithnjë e më të përhapura. Ekziston një numër në rritje i literaturës që tregon përdorimin e AI në fusha të ndryshme si biznesi, vendimmarrja me aksione të larta dhe gjatë viteve të fundit në sektorin mjekësor. Megjithatë, me këtë përhapje në rritje, njerëzit kanë vënë re tendencat shqetësuese në sistemet e përmendura; Kjo do të thotë, ndërsa janë krijuar në thelb për të ndjekur thjesht modele në të dhëna, ato kanë shfaqur shenja paragjykimi, në kuptimin që mund të vërehen sjellje të ndryshme seksiste dhe diskriminuese. E fundit Akti Evropian i AI, gjithashtu mbulon çështjen e një paragjykimi të tillë mjaft gjerësisht dhe vendos një bazë për trajtimin e problemeve që lidhen me të. 

Gjatë gjithë viteve të dokumentacionit teknik, njerëzit kanë prirur të përdorin termin "paragjykim" për të përshkruar këtë lloj sjelljeje të anuar ndaj demografive të caktuara; një fjalë kuptimi i së cilës ndryshon, duke shkaktuar konfuzion dhe duke e komplikuar detyrën e adresimit të saj.

Ky artikull është i pari në një seri postimesh në blog që mbulojnë temën e paragjykimit. Në këtë seri, ne do të synojmë t'ju japim një kuptim të qartë dhe të tretshëm të paragjykimeve në AI. Ne do të prezantojmë mënyra për të matur dhe minimizuar paragjykimet dhe do të eksplorojmë rolin e të dhënave sintetike në këtë rrugë drejt sistemeve më të drejta. Ne do t'ju japim gjithashtu një vështrim se si Syntho, një lojtar kryesor në gjenerimin e të dhënave sintetike, mund të kontribuojë në këtë përpjekje. Pra, nëse jeni një praktikues që kërkon njohuri të zbatueshme ose thjesht kurioz për këtë temë, ju jeni në vendin e duhur.

Paragjykimi në veprim: Një shembull i botës reale

Ju mund të pyesni veten, "Ky paragjykim në AI është gjithçka i rëndësishëm, por çfarë do të thotë për mua, për njerëzit e zakonshëm?" E vërteta është se ndikimi është i gjerë, shpesh i padukshëm, por i fuqishëm. Paragjykimi në AI nuk është një koncept thjesht akademik; është një problem i botës reale me pasoja të rënda.

Merrni si shembull skandalin holandez të mirëqenies së fëmijëve. Sistemi i automatizuar, gjoja një mjet i krijuar për të gjeneruar rezultate të drejta dhe efikase me ndërhyrje minimale njerëzore, ishte i njëanshëm. Ai shënoi gabimisht mijëra prindër për mashtrim bazuar në të dhëna dhe supozime të gabuara. Rezultati? Familjet e futura në trazira, reputacioni personal i dëmtuar dhe vështirësi financiare, të gjitha për shkak të paragjykimeve në një sistem AI. Janë shembuj si këta që theksojnë urgjencën e adresimit të paragjykimeve në AI.

njerëzit që protestojnë

Por le të mos ndalemi me kaq. Ky incident nuk është një rast i izoluar i njëanshmërisë duke shkaktuar kërdi. Ndikimi i paragjykimit në AI shtrihet në të gjitha anët e jetës sonë. Nga kush punësohet për një punë, kush merr miratimin për një kredi, tek kush merr çfarë lloj trajtimi mjekësor – sistemet e njëanshme të AI mund të përjetësojnë pabarazitë ekzistuese dhe të krijojnë të reja.

Merrni parasysh këtë: një sistem i AI i trajnuar mbi të dhëna të njëanshme historike mund t'i mohojë një kandidati të kualifikuar një punë thjesht për shkak të gjinisë ose përkatësisë etnike. Ose një sistem i njëanshëm i AI mund t'i mohojë një hua një kandidati të merituar për shkak të kodit të tyre postar. Këta nuk janë thjesht skenarë hipotetikë; po ndodhin pikërisht tani.

Llojet specifike të paragjykimeve, të tilla si Paragjykimi Historik dhe Paragjykimi i Matjes, çojnë në vendime të tilla të meta. Ato janë të natyrshme në të dhëna, të rrënjosura thellë në paragjykimet shoqërore dhe reflektohen në rezultatet e pabarabarta midis grupeve të ndryshme demografike. Ata mund të anojnë vendimet e modeleve parashikuese dhe të rezultojnë në trajtim të padrejtë.

Në skemën e madhe të gjërave, paragjykimi në AI mund të veprojë si një ndikues i heshtur, duke formësuar në mënyrë delikate shoqërinë dhe jetën tonë, shpesh në mënyra që ne as nuk i kuptojmë. Të gjitha këto pika të lartpërmendura mund t'ju bëjnë të pyesni pse nuk janë ndërmarrë veprime për të ndaluar dhe nëse është e mundur.

Në të vërtetë, me përparimet e reja teknologjike, bëhet gjithnjë e më e arritshme për të trajtuar një problem të tillë. Hapi i parë për të adresuar këtë problem, megjithatë, është të kuptosh dhe të pranosh ekzistencën dhe ndikimin e tij. Tani për tani, njohja e ekzistencës së saj është krijuar, duke e lënë çështjen e "mirëkuptimit" ende të paqartë. 

Kuptimi i paragjykimeve

Ndërsa përkufizimi origjinal i paragjykimit siç është paraqitur nga Fjalori i Kembrixhit nuk largohet shumë nga qëllimi kryesor i fjalës pasi lidhet me AI, duhet të bëhen shumë interpretime të ndryshme edhe për këtë përkufizim njëjës. Taksonomitë, si ato të paraqitura nga studiues si p.sh Hellström et al (2020) Kliegr (2021), ofrojnë njohuri më të thella në përkufizimin e paragjykimit. Megjithatë, një vështrim i thjeshtë në këto dokumente do të zbulojë se kërkohet një ngushtim i madh i përkufizimit të termit për të trajtuar në mënyrë efektive problemin. 

Ndërsa është një ndryshim i ngjarjeve, për të përcaktuar dhe përcjellë në mënyrë optimale kuptimin e paragjykimit, mund të përcaktohet më mirë e kundërta, që është Drejtësia. 

Përcaktimi i Drejtësisë 

Siç përcaktohet në literaturë të ndryshme të kohëve të fundit si p.sh Castelnovo etj. (2022), drejtësia mund të shtjellohet duke pasur parasysh një kuptim të termit hapësirë ​​potenciale. Sikurse ekziston, hapësira potenciale (PS) i referohet shkallës së aftësive dhe njohurive të një individi pavarësisht nga përkatësia e tij në një grup të caktuar demografik. Duke pasur parasysh këtë përkufizim të konceptit të PS, mund të përkufizohet lehtësisht drejtësia si barazia e trajtimit midis dy individëve me PS të barabartë, pavarësisht nga dallimet e tyre të dukshme dhe të fshehura në parametrat që shkaktojnë paragjykim (të tilla si raca, mosha ose gjinia). Çdo shmangie nga ky përkufizim, i quajtur edhe Barazia e Mundësive, është një tregues i qartë i njëanshmërisë dhe meriton hetim të mëtejshëm.  

Praktikuesit midis lexuesve mund të vërejnë se arritja e diçkaje siç përcaktohet këtu mund të jetë krejtësisht e pamundur duke pasur parasysh paragjykimet e qenësishme që ekzistojnë në botën tonë. Kjo eshte e vertete! Bota në të cilën jetojmë, së bashku me të gjitha të dhënat e mbledhura nga dukuritë në këtë botë, i nënshtrohet shumë paragjykimeve historike dhe statistikore. Kjo, në të vërtetë, zvogëlon besimin e një dite duke zbutur plotësisht ndikimet e paragjykimit në modelet parashikuese të trajnuara për të dhëna të tilla "të njëanshme". Megjithatë, përmes përdorimit të metodave të ndryshme, mund të përpiqeni të minimizoni ndikimet e paragjykimeve. Duke qenë kështu, terminologjia e përdorur në pjesën tjetër të këtij postimi(et) në blog do të zhvendoset drejt idesë së minimizimit të ndikimit të paragjykimit në vend që ta zbusë plotësisht atë.

Mirë! Pra, tani që është paraqitur një ide se çfarë është paragjykimi dhe si mund të vlerësohet potencialisht ekzistenca e tij; Megjithatë, nëse duam ta trajtojmë problemin siç duhet, duhet të dimë se nga e kanë origjinën të gjitha këto paragjykime.

Kuptimi i burimeve dhe llojeve

Hulumtimi ekzistues ofron njohuri të vlefshme për llojet e ndryshme të paragjykimeve në mësimin e makinerive. Si Mehrabi etj. al. (2019) kanë vazhduar të ndajnë paragjykimet në mësimin e makinerive, paragjykimet mund të ndahen në 3 kategori kryesore. Konkretisht ato të:

  • Të dhënat në algoritëm: një kategori që përfshin paragjykimet që burojnë nga vetë të dhënat. Mund të shkaktohet nga mbledhja e dobët e të dhënave, paragjykimet e natyrshme që ekzistojnë në botë, etj.
  • Algoritmi për përdoruesin: një kategori që fokusohet në paragjykimet që rrjedhin nga dizajni dhe funksionaliteti i algoritmeve. Ai përfshin sesi algoritmet mund të interpretojnë, peshojnë ose konsiderojnë pika të caktuara të të dhënave mbi të tjerat, të cilat mund të çojnë në rezultate të njëanshme.
  • Përdoruesi ndaj të dhënave: ka të bëjë me paragjykimet që lindin nga ndërveprimi i përdoruesit me sistemin. Mënyra në të cilën përdoruesit futin të dhëna, paragjykimet e tyre të qenësishme, apo edhe besimi i tyre në rezultatet e sistemit mund të ndikojnë në rezultatet.
grafik

Figura 1: Një vizualizim i kornizës CRISP-DM për nxjerrjen e të dhënave; përdoret zakonisht në nxjerrjen e të dhënave dhe është e rëndësishme për procesin e identifikimit të fazave në të cilat paragjykimi mund të ekzistojë.

Ndërsa emrat janë tregues të formës së paragjykimit, mund të ketë ende pyetje në lidhje me llojet e paragjykimeve që mund të kategorizohen nën këto terma ombrellë. Për të apasionuarit në mesin e lexuesve tanë, ne kemi ofruar lidhje me disa literaturë në lidhje me këtë terminologji dhe klasifikim. Për hir të thjeshtësisë në këtë postim në blog, ne do të mbulojmë disa paragjykime të zgjedhura që janë të rëndësishme për situatën (Pothuajse të gjitha janë të kategorisë së të dhënave për algoritmin). Llojet specifike të paragjykimeve janë si më poshtë:

  • Paragjykimi historik: Një lloj paragjykimi i qenësishëm i të dhënave të shkaktuara nga paragjykimet natyrore që ekzistojnë në botë në grupe të ndryshme shoqërore dhe shoqëri në përgjithësi. Është për shkak të ekzistencës së këtyre të dhënave në botë që ato nuk mund të zbuten përmes mjeteve të ndryshme të kampionimit dhe përzgjedhjes së veçorive.
  • Paragjykimi i matjes dhe paragjykimi i përfaqësimit: Këto dy paragjykime të lidhura ngushtë ndodhin kur nëngrupet e ndryshme të grupit të të dhënave përmbajnë sasi të pabarabarta të rezultateve "të favorshme". Prandaj, ky lloj paragjykimi mund të shtrembërojë rezultatin e modeleve parashikuese
  • Paragjykimi algoritmik: Paragjykimi i lidhur thjesht me algoritmin në përdorim. Siç vërehet edhe në testet e kryera (të shtjelluara më tej në postim), ky lloj paragjykimi mund të ketë një efekt të jashtëzakonshëm në drejtësinë e një algoritmi të caktuar.

Këto kuptime themelore të paragjykimeve në mësimin e makinerive do të përdoren për të trajtuar problemin në mënyrë më efektive në postimet e mëvonshme.

Mendime përfundimtare

Në këtë eksplorim të paragjykimeve brenda inteligjencës artificiale, ne kemi ndriçuar implikimet e thella që ajo ka në botën tonë gjithnjë e më të drejtuar nga AI. Nga shembujt e botës reale si skandali holandez i mirëqenies së fëmijëve deri te nuancat e ndërlikuara të kategorive dhe llojeve të paragjykimeve, është e qartë se njohja dhe të kuptuarit e paragjykimeve është parësore.

Ndërsa sfidat e paraqitura nga paragjykimet – qofshin ato historike, algoritmike ose të shkaktuara nga përdoruesit – janë të rëndësishme, ato nuk janë të pakapërcyeshme. Me një zotërim të fortë mbi origjinën dhe manifestimet e paragjykimeve, ne jemi më të pajisur për t'i trajtuar ato. Megjithatë, njohja dhe mirëkuptimi janë vetëm pikat fillestare.

Ndërsa ecim përpara në këtë seri, fokusi ynë i ardhshëm do të jetë në mjetet dhe kornizat e prekshme që kemi në dispozicion. Si e masim shtrirjen e paragjykimit në modelet e AI? Dhe më e rëndësishmja, si ta minimizojmë ndikimin e tij? Këto janë pyetjet e ngutshme në të cilat do të shqyrtojmë më pas, duke siguruar që ndërsa AI vazhdon të evoluojë, ajo e bën këtë në një drejtim që është sa i drejtë dhe performues.

grup njerëzish duke buzëqeshur

Të dhënat janë sintetike, por ekipi ynë është real!

Kontaktoni Syntho dhe një nga ekspertët tanë do të kontaktojë me ju me shpejtësinë e dritës për të eksploruar vlerën e të dhënave sintetike!