Невидениот виновник на вештачката интелигенција: Откривање на пристрасноста внатре

Серија блогови за пристрасност: дел 1

Вовед

Во нашиот свет на сè повеќе вештачки форми на интелигенција, машините кои имаат задача да донесуваат сложени одлуки стануваат сè поприсутни. Има сè поголем број на литература што укажува на употребата на вештачката интелигенција во различни домени како што се бизнисот, донесувањето одлуки со висок влог и во текот на изминатите неколку години во медицинскиот сектор. Меѓутоа, со оваа растечка преваленца, луѓето забележаа загрижувачки тенденции во споменатите системи; Односно, иако се инхерентно дизајнирани за чисто следење на обрасците во податоците, тие покажаа знаци на предрасуди, во смисла дека може да се забележат различно сексистичко и дискриминаторско однесување. Неодамнешните Европски закон за вештачка интелигенција, исто така, прилично опширно го опфаќа прашањето за таквите предрасуди и поставува основа за справување со проблемите поврзани со нив. 

Низ годините на техничка документација, луѓето имаат тенденција да го користат терминот „пристрасност“ за да го опишат овој искривен тип на однесување кон одредени демографија; збор чие значење варира, предизвикувајќи конфузија и комплицирајќи ја задачата за негово обраќање.

Оваа статија е прва во серијата на блог постови кои ја покриваат темата на пристрасност. Во оваа серија, ќе се обидеме да ви дадеме јасно, сварливо разбирање за пристрасноста во вештачката интелигенција. Ќе воведеме начини за мерење и минимизирање на пристрасноста и ќе ја истражиме улогата на синтетичките податоци на овој пат кон пофер системи. Исто така, ќе ви дадеме ѕир во тоа како Syntho, водечки играч во генерирањето на синтетички податоци, може да придонесе за овој напор. Значи, без разлика дали сте практичар кој бара функционални сознанија или само љубопитни за оваа тема, вие сте на вистинското место.

Пристрасност во акција: Пример од реалниот свет

Можеби се прашувате: „Оваа пристрасност во вештачката интелигенција е важна, но што значи тоа за мене, за обичните луѓе? Вистината е дека влијанието е далекусежно, често невидливо, но силно. Пристрасноста во вештачката интелигенција не е обичен академски концепт; тоа е реален проблем со сериозни последици.

Земете го како пример холандскиот скандал за заштита на децата. Автоматизираниот систем, наводно алатка создадена за генерирање фер и ефикасни резултати со минимална човечка интервенција, беше пристрасен. Погрешно означи илјадници родители за измама врз основа на погрешни податоци и претпоставки. Резултатот? Семејства фрлени во немири, нарушена лична репутација и финансиски тешкотии, сето тоа поради предрасудите во системот за вештачка интелигенција. Токму таквите примери ја истакнуваат итноста за решавање на пристрасноста во вештачката интелигенција.

луѓе кои протестираат

Но, да не застанеме тука. Овој инцидент не е изолиран случај на пристрасност што предизвикува хаос. Влијанието на пристрасноста во вештачката интелигенција се протега на сите делови од нашите животи. Од тоа кој се вработува за работа, кој добива одобрение за заем, до кој добива каков вид на медицински третман - пристрасните системи за вештачка интелигенција можат да ги овековечат постоечките нееднаквости и да создадат нови.

Размислете за ова: систем за вештачка интелигенција обучен за пристрасни историски податоци може да му ускрати работа на добро квалификуван кандидат само поради нивниот пол или етничка припадност. Или пристрасен систем за вештачка интелигенција може да одбие заем на заслужен кандидат поради неговиот поштенски код. Ова не се само хипотетички сценарија; тие се случуваат токму сега.

Специфичните типови на предрасуди, како што се историската пристрасност и мерната пристрасност, водат до такви погрешни одлуки. Тие се својствени за податоците, длабоко вкоренети во општествените предрасуди и се рефлектираат во нееднаквите резултати меѓу различните демографски групи. Тие можат да ги искриват одлуките на предвидливите модели и да резултираат со нефер третман.

Во големата шема на нештата, пристрасноста во вештачката интелигенција може да дејствува како тивок инфлуенсер, суптилно обликувајќи го нашето општество и нашите животи, често на начини на кои не ни сфаќаме. Сите овие горенаведени точки може да ве наведат да се запрашате зошто не се преземени активности за да се запре и дали е воопшто можно.

Навистина, со новите технолошки достигнувања станува сè подостапно да се справи со таков проблем. Првиот чекор за решавање на овој проблем, сепак, е да се разбере и да се признае неговото постоење и влијание. Засега, признавањето на неговото постоење е создадено, оставајќи го прашањето за „разбирање“ да биде сè уште прилично нејасно. 

Разбирање на пристрасност

Додека оригиналната дефиниција за пристрасност како што е претставена од страна на Речник Кембриџ не се оддалечува премногу од главната цел на зборот бидејќи се однесува на вештачката интелигенција, треба да се направат многу различни толкувања дури и на оваа единствена дефиниција. Таксономии, како оние што ги презентираат истражувачите како што се Hellström et al (2020) Клигр (2021), дајте подлабок увид во дефиницијата за пристрасност. Едноставен поглед на овие трудови, сепак, ќе открие дека е потребно големо стеснување на дефиницијата на терминот за ефективно да се реши проблемот. 

Иако е промена на настаните, за оптимално да се дефинира и да се пренесе значењето на пристрасноста, може подобро да се дефинира спротивното, тоа е правичност. 

Дефинирање на правичност 

Како што е дефинирано во различна понова литература како на пр Кастелново и сор. (2022), правичноста може да се елаборира врз основа на разбирање на поимот потенцијален простор. Како што постои, потенцијалниот простор (ПС) се однесува на степенот на способности и знаење на поединецот без разлика на неговата припадност на одредена демографска група. Со оглед на оваа дефиниција за концептот на ПС, лесно може да се дефинира правичноста како еднаков третман помеѓу две индивидуи со еднаков ПС, без оглед на нивните забележливи и скриени разлики во параметрите што предизвикуваат пристрасност (како раса, возраст или пол). Секое отстапување од оваа дефиниција, наречена и еднаквост на можности, е јасен показател за пристрасност и заслужува понатамошна истрага.  

Практичарите меѓу читателите може да забележат дека постигнувањето на нешто како што е дефинирано овде може да биде целосно невозможно со оглед на вродените предрасуди што постојат во нашиот свет. Тоа е вистина! Светот во кој живееме, заедно со сите податоци собрани од појавите во овој свет, е предмет на многу историски и статистички пристрасност. Ова, навистина, ја намалува довербата за еден ден целосно ублажување на влијанијата на пристрасноста врз предвидливите модели обучени за такви „пристрасни“ податоци. Меѓутоа, преку употреба на различни методи, може да се обиде да ги минимизира влијанијата на пристрасноста. Во овој случај, терминологијата што се користи во остатокот од овој блог пост(и) ќе се префрли кон идејата за минимизирање на влијанието на пристрасноста наместо целосно да се ублажи.

Добро! Сега кога се појави идеја за тоа што е пристрасност и како може потенцијално да се оцени нејзиното постоење; Меѓутоа, ако сакаме правилно да се справиме со проблемот, треба да знаеме од каде потекнуваат сите овие предрасуди.

Разбирање на изворите и видовите

Постоечкото истражување дава вредни сознанија за различните типови на предрасуди во машинското учење. Како Мехраби и др. ал. (2019) почнаа да ги делат предрасудите во машинското учење, може да се поделат предрасудите во 3 главни категории. Имено оние од:

  • Податоци во алгоритам: категорија која опфаќа предрасуди кои потекнуваат од самите податоци. Можеби тоа е предизвикано од лошо собирање податоци, вродени предрасуди што постојат во светот итн.
  • Алгоритам до корисник: категорија која се фокусира на предрасуди кои произлегуваат од дизајнот и функционалноста на алгоритмите. Вклучува како алгоритмите би можеле да интерпретираат, измерат или земаат предвид одредени точки на податоци во однос на другите, што може да доведе до пристрасни резултати.
  • Корисник до податоци: се однесува на предрасуди кои произлегуваат од интеракцијата на корисникот со системот. Начинот на кој корисниците внесуваат податоци, нивните инхерентни предрасуди или дури и нивната доверба во системските излези може да влијаат на резултатите.
графикон

Слика 1: Визуелизација на рамката CRISP-DM за ископување податоци; вообичаено се користат во рударството на податоци и се релевантни за процесот на идентификување на фазите во кои може да се појави пристрасност.

Иако имињата се индикативни за формата на пристрасност, некој сè уште може да има прашања во врска со видовите на предрасуди што може да се категоризираат под овие чадор термини. За ентузијастите меѓу нашите читатели, обезбедивме линкови до некоја литература поврзана со оваа терминологија и класификација. Заради едноставност во овој блог пост, ќе опфатиме неколку избрани предрасуди кои се релевантни за ситуацијата (речиси сите се од категоријата податоци за алгоритам). Специфичните типови на предрасуди се како што следува:

  • Историска пристрасност: Вид на пристрасност својствена за податоците предизвикани од природните предрасуди што постојат во светот во различни општествени групи и општеството воопшто. Токму поради инхерентноста на овие податоци во светот тие не можат да се ублажат преку различни средства за земање примероци и избор на карактеристики.
  • Пристрасност при мерење и пристрасност на претставување: Овие две тесно поврзани предрасуди се јавуваат кога различните подгрупи од збирката податоци содржат нееднакви количини на „поволни“ исходи. Овој тип на пристрасност затоа може да го искриви исходот на предвидливите модели
  • Алгоритамска пристрасност: Пристрасност чисто поврзана со алгоритмот што се користи. Како што исто така беше забележано во извршените тестови (објаснети понатаму во објавата), овој тип на пристрасност може да има огромен ефект врз правичноста на даден алгоритам.

Овие основни сфаќања за пристрасноста во машинското учење ќе се користат со цел поефикасно да се справиме со проблемот во подоцнежните објави.

Последни мисли

Во ова истражување на пристрасноста во рамките на вештачката интелигенција, ги расветливме длабоките импликации што ги има во нашиот свет кој се повеќе управува со вештачката интелигенција. Од реалните примери како холандскиот скандал за заштита на децата до сложените нијанси на категории и типови на пристрасност, очигледно е дека препознавањето и разбирањето на пристрасноста е најважно.

Иако предизвиците што ги предизвикуваат предрасудите - без разлика дали се историски, алгоритамски или предизвикани од корисниците - се значајни, тие не се непремостливи. Со цврсто разбирање за потеклото и манифестациите на пристрасност, ние сме подобро опремени да ги решиме. Сепак, признавањето и разбирањето се само појдовни точки.

Како што одиме напред во оваа серија, нашиот следен фокус ќе биде на опипливите алатки и рамки со кои располагаме. Како го мериме степенот на пристрасност кај моделите со вештачка интелигенција? И уште поважно, како да го минимизираме неговото влијание? Ова се неодложните прашања на кои ќе истражуваме следно, осигурувајќи дека како што вештачката интелигенција продолжува да се развива, тоа го прави во насока која е и праведна и извонредна.

група на луѓе кои се смешкаат

Податоците се синтетички, но нашиот тим е реален!

Контактирајте со Синто и еден од нашите експерти ќе стапи во контакт со вас со брзина на светлината за да ја истражи вредноста на синтетичките податоци!