Жасанды интеллекттің көрінбейтін кінәсі: ішкі көзқарасты ашу

Биас блогының сериясы: 1 бөлім

кіріспе

Барған сайын жасанды интеллект формалары әлемімізде күрделі шешімдер қабылдау міндеті жүктелген машиналар барған сайын кең таралуда. AI-ны бизнес, маңызды шешімдер қабылдау сияқты әртүрлі салаларда және соңғы бірнеше жылда медициналық секторда қолдануды көрсететін әдебиеттер саны өсуде. Бұл өсіп келе жатқан таралумен, алайда, адамдар аталған жүйелердегі тенденцияларға қатысты байқады; Яғни, деректердегі заңдылықтарды ұстануға жаратылғанымен, олар әртүрлі сексистік және кемсітушілік мінез-құлық байқалуы мүмкін деген мағынада теріс пікірдің белгілерін көрсетті. Жақында Еуропалық AI актісі, сондай-ақ мұндай теріс пікір мәселесін кеңінен қамтиды және онымен байланысты проблемаларды шешуге негіз қалады. 

Техникалық құжаттаманың барлық жылдарында адамдар белгілі бір демографиялық көрсеткіштерге қатысты мінез-құлықтың осы қисық түрін сипаттау үшін «біржақтылық» терминін қолдануға бейім болды; мағынасы өзгеріп, шатастырып, оны шешу міндетін қиындататын сөз.

Бұл мақала бейтараптық тақырыбын қамтитын блог жазбаларының біріншісі. Бұл серияда біз сізге AI-дағы қиғаштық туралы нақты, сіңімді түсінік беруді мақсат етеміз. Біз біржақтылықты өлшеу және азайту жолдарын енгіземіз және осы жолдағы синтетикалық деректердің рөлін неғұрлым әділ жүйелерге апаратын боламыз. Сондай-ақ біз сізге синтетикалық деректерді генерациялаудағы жетекші ойыншы Syntho осы күшке қалай үлес қоса алатынын көреміз. Сонымен, сіз практикалық тәжірибе іздейтін маман болсаңыз да немесе осы тақырыпқа қызығушылық танытсаңыз да, сіз дұрыс жердесіз.

Іс-әрекеттегі бейтараптық: нақты әлемдегі мысал

Сіз «AI-дағы бұл біржақтылық маңызды, бірақ мен үшін, қарапайым адамдар үшін бұл нені білдіреді?» Деген сұрақ туындауы мүмкін. Шындығында, әсер өте кең, көбінесе көрінбейді, бірақ күшті. AI-дағы біржақтылық жай ғана академиялық түсінік емес; бұл ауыр зардаптары бар нақты әлемдік мәселе.

Мысал ретінде Голландиядағы балалардың әл-ауқаты туралы жанжалды алайық. Автоматтандырылған жүйе, адамның ең аз араласуымен әділ және тиімді нәтижелерді алу үшін жасалған құрал деп болжанған. Ол қате деректер мен болжамдар негізінде мыңдаған ата-аналарды алаяқтық үшін қате белгіледі. Нәтиже? Жасанды интеллект жүйесіндегі біржақтылыққа байланысты отбасылар күйзелістерге ұшырады, жеке беделі бұзылды және қаржылық қиындықтар. Дәл осындай мысалдар AI-дағы біржақтылықты жоюдың өзектілігін көрсетеді.

наразылық білдірген адамдар

Бірақ мұнымен тоқтап қалмайық. Бұл оқиға күйзеліс тудыратын біржақты оқиға емес. Жасанды интеллектке бейімділіктің әсері біздің өміріміздің барлық бұрыштарына таралады. Кім жұмысқа қабылданады, кім несиеге мақұлданады, кім қандай медициналық ем алады – бейтарап AI жүйелері бұрыннан бар теңсіздіктерді жалғастырып, жаңасын жасай алады.

Мынаны қарастырыңыз: біржақты тарихи деректерге негізделген AI жүйесі жақсы білікті кандидатты тек жынысына немесе этникалық тегіне байланысты жұмыстан бас тартуы мүмкін. Немесе бейтарап AI жүйесі лайықты үміткерге пошта индексіне байланысты несие беруден бас тартуы мүмкін. Бұл жай ғана гипотетикалық сценарийлер емес; олар дәл қазір болып жатыр.

Тарихи қиғаштық және өлшемді қиғаштық сияқты бұрмалаулардың ерекше түрлері осындай қате шешімдерге әкеледі. Олар деректерге тән, қоғамда терең тамыр жайған және әртүрлі демографиялық топтар арасындағы тең емес нәтижелерде көрінеді. Олар болжамды модельдердің шешімдерін бұрмалап, әділетсіз қарауға әкелуі мүмкін.

Үлкен схемада AI-дағы бейтараптық біздің қоғам мен өмірімізді нәзік түрде қалыптастыратын үнсіз әсер етуші ретінде әрекет етуі мүмкін, көбінесе біз түсінбейтін тәсілдермен. Жоғарыда аталған барлық мәселелер сізді тоқтату үшін неге шаралар қабылданбады және бұл мүмкін бе деген сұрақтарға әкелуі мүмкін.

Шынында да, жаңа технологиялық жетістіктермен мұндай мәселені шешу оңайырақ болады. Алайда бұл мәселені шешудің бірінші қадамы оның бар болуы мен әсерін түсіну және мойындау болып табылады. Әзірге оның бар екенін мойындау жасалды, бұл «түсіну» мәселесін әлі де бұлыңғыр етіп қалдырды. 

Біржақтылықты түсіну

ұсынған бастапқы анықтамасы болғанымен Кембридж сөздігі AI-ға қатысты сөздің негізгі мақсатынан тым алшақ кетпейді, тіпті осы бірегей анықтамаға көптеген әртүрлі түсіндірулер жасалуы керек. сияқты зерттеушілер ұсынған таксономиялар Hellström және басқалар (2020) және Клиегр (2021), қиғаштық анықтамасы туралы тереңірек түсінік береді. Бұл құжаттарға қарапайым көзқарас, алайда, мәселені тиімді шешу үшін терминнің анықтамасын айтарлықтай тарылту қажет екенін көрсетеді. 

Оқиғалардың өзгеруі бола тұра, біржақтылықтың мәнін оңтайлы анықтау және жеткізу үшін керісінше, яғни Әділдікті жақсырақ анықтауға болады. 

Әділдікті анықтау 

сияқты соңғы әдебиеттерде анықталғандай Castelnovo және т.б. (2022), әлеуетті кеңістік терминін түсінгеннен кейін әділеттілікті кеңейтуге болады. Бар болғандықтан, әлеуетті кеңістік (PS) белгілі бір демографиялық топқа жататындығына қарамастан жеке адамның мүмкіндіктері мен білімінің көлемін білдіреді. PS түсінігінің осы анықтамасын ескере отырып, әділеттілікті тең PS екі индивидуалды көзқарасты тудыратын параметрлердегі бақыланатын және жасырын айырмашылықтарына қарамастан (мысалы, нәсіл, жас немесе жыныс) арасындағы қатынас теңдігі деп оңай анықтауға болады. Мүмкіндіктер теңдігі деп те аталатын бұл анықтамадан кез келген ауытқу біржақтылықтың айқын көрсеткіші және әрі қарай зерттеуді қажет етеді.  

Оқырмандардың арасындағы тәжірибешілер біздің әлемде бар тән қиғаштықтарды ескере отырып, мұнда анықталған нәрсеге қол жеткізу мүмкін емес екенін байқауы мүмкін. Бұл шындық! Біз өмір сүріп жатқан әлем осы дүниедегі оқиғалардан жиналған барлық деректермен бірге көптеген тарихи және статистикалық ауытқуларға ұшырайды. Бұл, шынында да, осындай «біржақты» деректерге үйретілген болжамды модельдерге біржақтылықтың әсерін толығымен жеңілдететін бір күннің сенімділігін төмендетеді. Дегенмен, әртүрлі әдістерді қолдану арқылы біржақтылықтың әсерін азайтуға болады. Олай болса, осы блог жазбаларының қалған бөлігінде қолданылған терминология теріс әсерді толығымен азайтудың орнына барынша азайту идеясына ауысады.

Жақсы! Енді біржақтылық деген не және оның бар болуын қалай бағалауға болатыны туралы идея пайда болды; Егер біз мәселені дұрыс шешкіміз келсе, онда бұл қиғаштықтардың қайдан шыққанын білуіміз керек.

Дереккөздер мен түрлері туралы түсінік

Қолданыстағы зерттеулер машиналық оқытудағы әртүрлі ауытқулар түрлері туралы құнды түсініктер береді. ретінде Мехраби және т. ал. (2019) машиналық оқытудағы қиғаштықтарды бөлуге кірісті, біржақтылықты 3 негізгі санатқа бөлуге болады. Атап айтқанда:

  • Алгоритмге деректер: деректердің өзінен туындайтын ауытқуларды қамтитын категория. Бұл нашар деректерді жинаудан, әлемде бар тән ауытқулардан туындауы мүмкін.
  • Algorithm to User: алгоритмдердің дизайны мен функционалдығынан туындайтын ауытқуларға бағытталған санат. Ол алгоритмдердің кейбір деректер нүктелерін басқаларға қарағанда қалай түсіндіруі, өлшеуі немесе қарастыруы мүмкін екенін қамтиды, бұл біржақты нәтижелерге әкелуі мүмкін.
  • Пайдаланушыдан деректерге: пайдаланушының жүйемен әрекеттесуінен туындайтын ауытқуларға қатысты. Пайдаланушылардың деректерді енгізу тәсілі, олардың тән ауытқулары немесе тіпті олардың жүйе нәтижелеріне сенімі нәтижелерге әсер етуі мүмкін.
графика

1-сурет: Деректерді өндіруге арналған CRISP-DM құрылымының визуализациясы; әдетте деректерді өндіруде қолданылады және қиғаштық пайда болуы мүмкін кезеңдерді анықтау процесіне қатысты.

Атаулар қиғаштық нысанын көрсетсе де, осы қолшатыр терминдер бойынша жіктеуге болатын қиғаштықтардың түрлеріне қатысты сұрақтар туындауы мүмкін. Оқырмандарымыздың әуесқойлары үшін біз осы терминология мен классификацияға қатысты кейбір әдебиеттерге сілтеме жасадық. Бұл блог жазбасында қарапайымдылық үшін біз жағдайға сәйкес келетін бірнеше таңдаулы қиғаштықтарды қарастырамыз (олардың барлығы дерлік категория деректері алгоритмге жатады). Артықшылықтардың ерекше түрлері келесідей:

  • Тарихи бетбұрыс: әртүрлі әлеуметтік топтарда және жалпы қоғамда әлемде бар табиғи бейімділіктерден туындаған деректерге тән бейімділік түрі. Дәл осы деректердің әлемге тән болғандықтан, оны әртүрлі сынамаларды алу және мүмкіндіктерді таңдау арқылы азайту мүмкін емес.
  • Өлшемнің қиғаштығы және өкілдіктің бұрмалануы: Бұл екі тығыз байланысты ауытқу деректер жиынының әртүрлі ішкі топтарында «қолайлы» нәтижелердің тең емес көлемі болған кезде орын алады. Демек, мұндай ауытқу түрі болжамды модельдердің нәтижесін бұрмалауы мүмкін
  • Алгоритмдік қиғаштық: тек қана қолданылатын алгоритмге қатысты ауытқу. Сондай-ақ жүргізілген сынақтарда байқалғандай (бұдан әрі постта қарастырылған), бұл бұрмалау түрі берілген алгоритмнің әділдігіне үлкен әсер етуі мүмкін.

Машиналық оқытудағы қиғаштық туралы бұл негізгі түсініктер мәселені кейінгі посттарда тиімдірек шешу үшін пайдаланылады.

Қорытынды ой

Жасанды интеллекттегі біржақтылықты зерттеуде біз оның AI басқаратын әлеміміздегі терең салдарын аштық. Голландиялық балалардың әл-ауқатына қатысты жанжал сияқты нақты мысалдардан біржақтылық санаттары мен түрлерінің күрделі нюанстарына дейін біржақтылықты тану және түсіну маңызды екені анық.

Тарихи, алгоритмдік немесе қолданушыдан туындаған біржақтылықтан туындайтын қиындықтар маңызды болғанымен, олар шешілмейтін емес. Біржақтылықтың шығу тегі мен көріністерін нық түсінгендіктен, біз оларды шешуге жақсырақ дайынбыз. Дегенмен, тану және түсіну тек бастапқы нүктелер болып табылады.

Осы серияда алға жылжып келе жатқанда, біздің келесі назарымыз біздің қолымыздағы материалдық құралдар мен құрылымдарға айналады. AI үлгілеріндегі қиғаштық дәрежесін қалай өлшейміз? Ең бастысы, оның әсерін қалай азайтуға болады? Бұл AI дамуын жалғастырған сайын оның әділ әрі нәтижелі бағытта болуын қамтамасыз ету үшін біз келесі өзекті сұрақтарды қарастырамыз.

күлген адамдар тобы

Деректер синтетикалық, бірақ біздің команда нақты!

Syntho компаниясына хабарласыңыз және біздің мамандардың бірі синтетикалық деректердің құндылығын зерттеу үшін сізбен жарық жылдамдығымен байланысады!