Невидимият виновник на изкуствения интелект: Разкриване на вътрешните пристрастия

Поредица от блогове на Bias: част 1

Въведение

В нашия свят на все по-изкуствени форми на интелект, машините, които имат за задача да вземат сложни решения, стават все по-разпространени. Има нарастващ обем от литература, посочваща използването на AI в различни области като бизнес, вземане на решения с високи залози и през последните няколко години в медицинския сектор. С това нарастващо разпространение обаче хората са забелязали тревожни тенденции в споменатите системи; Тоест, въпреки че по своята същност са проектирани да следват изцяло модели в данните, те са показали признаци на предразсъдъци, в смисъл, че могат да се наблюдават различни сексистки и дискриминационни поведения. Скорошното Европейски закон за ИИ, също обхваща въпроса за подобни предразсъдъци доста обширно и поставя основата за справяне с проблемите, свързани с тях. 

През годините на техническа документация хората са били склонни да използват термина „пристрастие“, за да опишат този изкривен тип поведение спрямо определени демографски групи; дума, чието значение варира, причинявайки объркване и усложнявайки задачата да се обърнем към нея.

Тази статия е първата от поредица публикации в блогове, обхващащи темата за пристрастията. В тази серия ще се стремим да ви дадем ясно, разбираемо разбиране за пристрастията в AI. Ще представим начини за измерване и минимизиране на отклоненията и ще проучим ролята на синтетичните данни в този път към по-справедливи системи. Ще ви дадем също така да надникнете как Syntho, водещ играч в генерирането на синтетични данни, може да допринесе за това усилие. Така че, независимо дали сте практик, който търси практически прозрения, или просто сте любопитни по тази тема, вие сте на правилното място.

Пристрастия в действие: пример от реалния свят

Може би се чудите: „Това пристрастие в ИИ е важно, но какво означава това за мен, за обикновените хора?“ Истината е, че въздействието е широкообхватно, често невидимо, но силно. Пристрастията в ИИ не са просто академична концепция; това е проблем от реалния свят със сериозни последствия.

Да вземем за пример холандския скандал със закрилата на децата. Автоматизираната система, за която се предполага, че е инструмент, създаден за генериране на честни и ефективни резултати с минимална човешка намеса, беше предубедена. Той погрешно маркира хиляди родители за измама въз основа на грешни данни и предположения. Резултатът? Семейства, хвърлени в сътресения, увредена лична репутация и финансови затруднения, всичко това поради пристрастия в AI система. Именно примери като тези подчертават спешността на справянето с пристрастията в ИИ.

хора протестиращи

Но да не спираме до тук. Този инцидент не е изолиран случай на пристрастие, причиняващо хаос. Въздействието на пристрастията в AI се простира до всички ъгли на живота ни. От това кой е нает на работа, кой получава одобрение за заем, до това кой получава какъв вид медицинско лечение – предубедените AI системи могат да увековечат съществуващите неравенства и да създадат нови.

Помислете за това: AI система, обучена на предубедени исторически данни, може да откаже работа на добре квалифициран кандидат само поради техния пол или етническа принадлежност. Или предубедена AI система може да откаже заем на заслужаващ кандидат заради пощенския му код. Това не са просто хипотетични сценарии; те се случват в момента.

Специфичните видове пристрастия, като историческо пристрастие и пристрастие при измерване, водят до такива погрешни решения. Те са присъщи на данните, дълбоко вкоренени в обществените пристрастия и отразени в неравните резултати сред различните демографски групи. Те могат да изкривят решенията на прогнозните модели и да доведат до несправедливо отношение.

В голямата схема на нещата, пристрастията в AI могат да действат като безмълвно влияние, неусетно оформяйки обществото и живота ни, често по начини, които дори не осъзнаваме. Всички тези гореспоменати точки може да ви накарат да се запитате защо не са предприети действия за спиране и дали изобщо е възможно.

Всъщност с новите технологични постижения справянето с подобен проблем става все по-достъпно. Първата стъпка към справянето с този проблем обаче е да разберем и признаем неговото съществуване и въздействие. Засега признанието за съществуването му е създадено, оставяйки въпроса за „разбирането“ все още доста неясен. 

Разбиране на пристрастията

Докато първоначалното определение за пристрастие, както е представено от Речник на Кеймбридж не се отклонява твърде далеч от основната цел на думата, тъй като се отнася до ИИ, трябва да се направят много различни тълкувания дори на това единствено определение. Таксономии, като тези, представени от изследователи като напр Хелстрьом и др. (2020 г.) намлява Kliegr (2021), осигуряват по-задълбочена представа за дефиницията на пристрастието. Един прост поглед върху тези документи ще разкрие обаче, че е необходимо значително стесняване на определението на термина, за да се справи ефективно с проблема. 

Въпреки че е промяна на събитията, за да се определи оптимално и предаде значението на пристрастието, може по-добре да се дефинира противоположното, което е справедливост. 

Определяне на справедливостта 

Както се определя в различни скорошни литератури, като напр Кастелново и др. (2022), справедливостта може да бъде разработена, като се има предвид разбирането на термина потенциално пространство. Както съществува, потенциалното пространство (PS) се отнася до степента на способностите и знанията на индивида, независимо от принадлежността му към определена демографска група. Като се има предвид тази дефиниция на концепцията за PS, може лесно да се определи справедливостта като равнопоставеност на третирането между двама индивида с еднакви PS, независимо от техните видими и скрити разлики в параметрите, предизвикващи пристрастия (като раса, възраст или пол). Всяко отклонение от това определение, наричано също Равенство на възможностите, е ясна индикация за пристрастност и заслужава допълнително разследване.  

Практиците сред читателите може да забележат, че постигането на нещо, както е дефинирано тук, може да е напълно невъзможно предвид присъщите пристрастия, съществуващи в нашия свят. Това е вярно! Светът, в който живеем, заедно с всички данни, събрани от събития в този свят, е обект на много исторически и статистически пристрастия. Това наистина намалява увереността един ден да смекчи напълно въздействието на пристрастията върху предсказуемите модели, обучени върху такива „предубедени“ данни. Въпреки това, чрез използването на различни методи, човек може да се опита да сведе до минимум въздействието на пристрастията. В такъв случай терминологията, използвана в останалата част от тази публикация(и) в блога, ще се измести към идеята за минимизиране на въздействието на пристрастията, вместо пълното му смекчаване.

Добре! Така че сега, когато е изведена идея какво е пристрастие и как може потенциално да се оцени неговото съществуване; Ако обаче искаме да се справим правилно с проблема, трябва да знаем откъде произлизат всички тези пристрастия.

Разбиране на източниците и типовете

Съществуващите изследвания предоставят ценна представа за различните видове отклонения в машинното обучение. Като Мехраби и др. ал. (2019) са пристъпили към разделяне на пристрастията в машинното обучение, могат да се разделят пристрастията на 3 основни категории. А именно тези на:

  • Данни към алгоритъм: категория, обхващаща отклонения, които произтичат от самите данни. Възможно е това да е причинено от лошо събиране на данни, присъщи пристрастия, съществуващи в света, и т.н.
  • Алгоритъм към потребителя: категория, фокусирана върху отклонения, произтичащи от дизайна и функционалността на алгоритмите. То включва как алгоритмите могат да интерпретират, претеглят или разглеждат определени точки от данни спрямо други, което може да доведе до пристрастни резултати.
  • Потребител към данни: отнася се до пристрастия, които възникват от взаимодействието на потребителя със системата. Начинът, по който потребителите въвеждат данни, присъщите им пристрастия или дори доверието им в системните резултати могат да повлияят на резултатите.
крива

Фигура 1: Визуализация на рамката CRISP-DM за извличане на данни; често се използва в извличането на данни и има отношение към процеса на идентифициране на етапите, в които може да възникне пристрастие.

Въпреки че имената са показателни за формата на пристрастие, все още може да имате въпроси относно видовете пристрастия, които може да категоризирате под тези общи термини. За ентусиастите сред нашите читатели сме предоставили връзки към литература, свързана с тази терминология и класификация. За по-голяма простота в тази публикация в блога ще разгледаме няколко избрани отклонения, които са подходящи за ситуацията (почти всички от които са от категорията данни към алгоритъм). Специфичните видове отклонения са както следва:

  • Историческо отклонение: Вид отклонение, присъщо на данните, причинено от естествените отклонения, съществуващи в света в различни социални групи и обществото като цяло. Именно поради присъщия характер на тези данни в света, те не могат да бъдат смекчени чрез различни средства за вземане на проби и избор на характеристики.
  • Пристрастия при измерване и отклонение на представянето: Тези две тясно свързани отклонения възникват, когато различните подгрупи на набора от данни съдържат неравни количества „благоприятни“ резултати. Следователно този тип отклонение може да изкриви резултата от прогнозните модели
  • Алгоритмично отклонение: Пристрастие, свързано изцяло с използвания алгоритъм. Както също се наблюдава при проведени тестове (разработени по-нататък в публикацията), този тип отклонение може да има огромен ефект върху справедливостта на даден алгоритъм.

Тези основни разбирания за пристрастия в машинното обучение ще бъдат използвани за по-ефективно справяне с проблема в следващите публикации.

Заключителни мисли

В това изследване на пристрастията в рамките на изкуствения интелект, ние осветлихме дълбоките последици, които има в нашия свят, който все повече се ръководи от AI. От примери от реалния свят като холандския скандал за благосъстоянието на децата до сложните нюанси на категориите и видовете пристрастия, очевидно е, че разпознаването и разбирането на пристрастията е от първостепенно значение.

Въпреки че предизвикателствата, породени от пристрастия - независимо дали са исторически, алгоритмични или предизвикани от потребителите - са значителни, те не са непреодолими. С твърдо разбиране на произхода и проявите на пристрастия, ние сме по-добре подготвени да се справим с тях. Признанието и разбирането обаче са само отправните точки.

Докато напредваме в тази серия, следващият ни фокус ще бъде върху материалните инструменти и рамки, с които разполагаме. Как да измерим степента на отклонение в моделите на AI? И което е по-важно, как да минимизираме въздействието му? Това са належащите въпроси, които ще разгледаме по-нататък, като гарантираме, че докато ИИ продължава да се развива, той го прави в посока, която е едновременно справедлива и ефективна.

група усмихнати хора

Данните са синтетични, но нашият екип е истински!

Свържете се със Syntho и един от нашите експерти ще се свърже с вас със скоростта на светлината, за да проучи стойността на синтетичните данни!