Neregėtas AI kaltininkas: šališkumo pašalinimas viduje

Šališkumo tinklaraščio serija: 1 dalis

Įvadas

Mūsų pasaulyje, kuriame vis labiau dirbtinės intelekto formos, mašinos, kurioms pavesta priimti sudėtingus sprendimus, tampa vis labiau paplitusios. Daugėja literatūros, nurodančios AI naudojimą įvairiose srityse, tokiose kaip verslas, svarbių sprendimų priėmimas ir per pastaruosius kelerius metus medicinos sektoriuje. Tačiau didėjant paplitimui, žmonės pastebėjo tendencijas šiose sistemose; Tai yra, nors jie iš prigimties buvo sukurti taip, kad atitiktų duomenų šablonus, jie parodė išankstinio nusistatymo požymius, nes galima pastebėti įvairų seksistinį ir diskriminacinį elgesį. Neseniai Europos AI aktas, taip pat gana plačiai apima tokio išankstinio nusistatymo klausimą ir sudaro pagrindą spręsti su tuo susijusias problemas. 

Per visus techninės dokumentacijos metus žmonės buvo linkę vartoti terminą „šališkumas“, apibūdindami šį iškreiptą elgesį su tam tikrais demografiniais rodikliais; žodis, kurio reikšmė skiriasi, sukeldama painiavą ir apsunkindama užduotį į jį kreiptis.

Šis straipsnis yra pirmasis iš tinklaraščio įrašų, apimančių šališkumo temą, serijos. Šioje serijoje sieksime suteikti jums aiškų ir suprantamą AI šališkumo supratimą. Pristatysime būdus, kaip išmatuoti ir sumažinti šališkumą, ir išnagrinėsime sintetinių duomenų vaidmenį siekiant teisingesnių sistemų. Taip pat pažvelgsime į tai, kaip „Syntho“, pirmaujanti sintetinių duomenų generavimo žaidėja, gali prisidėti prie šių pastangų. Taigi, nesvarbu, ar esate praktikas, ieškantis realių įžvalgų, ar tiesiog domitės šia tema, esate tinkamoje vietoje.

Šališkumas veikiant: realaus pasaulio pavyzdys

Jums gali kilti klausimas: „Šis AI šališkumas yra svarbus, bet ką tai reiškia man, paprastiems žmonėms? Tiesa ta, kad poveikis yra platus, dažnai nematomas, bet stiprus. AI šališkumas nėra vien akademinė sąvoka; tai realaus pasaulio problema su rimtomis pasekmėmis.

Kaip pavyzdį paimkite Nyderlandų vaiko gerovės skandalą. Automatizuota sistema, tariamai priemonė, sukurta siekiant užtikrinti sąžiningus ir efektyvius rezultatus su minimaliu žmogaus įsikišimu, buvo šališka. Remiantis klaidingais duomenimis ir prielaidomis, tūkstančiai tėvų buvo klaidingai pažymėti dėl sukčiavimo. Rezultatas? Šeimos, apimtos neramumų, sugadinta asmeninė reputacija ir finansiniai sunkumai – visa tai dėl AI sistemos šališkumo. Tokie pavyzdžiai kaip šie pabrėžia, kad būtina skubiai spręsti AI šališkumą.

protestuojančių žmonių

Tačiau nesustokime ties tuo. Šis incidentas nėra atskiras šališkumo atvejis, sukeliantis sumaištį. DI šališkumo poveikis apima visas mūsų gyvenimo sritis. Nuo to, kas samdomas darbui, kas gauna patvirtinimą dėl paskolos, kas gauna kokį nors gydymą – šališkos AI sistemos gali išlaikyti esamą nelygybę ir sukurti naujų.

Apsvarstykite tai: dirbtinio intelekto sistema, parengta remiantis šališkais istoriniais duomenimis, gali atimti aukštos kvalifikacijos kandidatą į darbą vien dėl jo lyties ar etninės priklausomybės. Arba šališka AI sistema gali atsisakyti suteikti paskolą nusipelniusiam kandidatui dėl jo pašto kodo. Tai ne tik hipotetiniai scenarijai; jie vyksta dabar.

Tam tikri šališkumo tipai, tokie kaip istorinis poslinkis ir matavimo šališkumas, lemia tokius klaidingus sprendimus. Jie yra neatsiejami nuo duomenų, giliai įsišakniję visuomenės šališkumo ir atspindi nevienodus įvairių demografinių grupių rezultatus. Jie gali iškreipti prognozuojamų modelių sprendimus ir sukelti nesąžiningą elgesį.

Iš esmės, AI šališkumas gali veikti kaip tylus įtakojantis veiksnys, subtiliai formuojantis mūsų visuomenę ir gyvenimą, dažnai taip, kad mes net nesuvokiame. Visi šie aukščiau išvardinti dalykai gali paskatinti jus suabejoti, kodėl nesiimta veiksmų sustabdyti ir ar tai apskritai įmanoma.

Tiesą sakant, dėl naujų technologijų pažangos tampa vis lengviau spręsti šią problemą. Tačiau pirmas žingsnis sprendžiant šią problemą yra suprasti ir pripažinti jos egzistavimą ir poveikį. Kol kas jos egzistavimo pripažinimas sukurtas, todėl „supratimo“ reikalas lieka gana miglotas. 

Šališkumo supratimas

Nors pradinis šališkumo apibrėžimas, pateiktas Kembridžo žodynas nenutolsta nuo pagrindinio žodžio tikslo, nes jis susijęs su AI, net ir šis vienaskaitos apibrėžimas turi būti interpretuojamas daug skirtingų. Taksonomijos, pavyzdžiui, pateiktos tokių tyrinėtojų kaip Hellström ir kt. (2020) ir Kliegr (2021 m.), pateikite gilesnių įžvalgų apie šališkumo apibrėžimą. Tačiau paprastas žvilgsnis į šiuos dokumentus parodys, kad norint veiksmingai išspręsti problemą, reikia labai susiaurinti termino apibrėžimą. 

Nors tai yra įvykių pasikeitimas, norint optimaliai apibrėžti ir perteikti šališkumo reikšmę, galima geriau apibrėžti priešingą, tai yra sąžiningumą. 

Sąžiningumo apibrėžimas 

Kaip apibrėžiama įvairiose naujausioje literatūroje, pvz Castelnovo ir kt. (2022 m.), teisingumą galima išplėsti supratus potencialios erdvės terminą. Tokia, kokia egzistuoja, potenciali erdvė (PS) reiškia individo gebėjimų ir žinių mastą, neatsižvelgiant į jo priklausymą tam tikrai demografinei grupei. Atsižvelgiant į šį PS sąvokos apibrėžimą, sąžiningumą galima nesunkiai apibrėžti kaip vienodą požiūrį į du vienodo PS individus, neatsižvelgiant į jų pastebimus ir paslėptus šališkumą sukeliančių parametrų (tokių kaip rasė, amžius ar lytis) skirtumus. Bet koks nukrypimas nuo šio apibrėžimo, dar vadinamo lygybėmis, yra aiškus šališkumo požymis ir vertas tolesnio tyrimo.  

Praktikuojantys skaitytojai gali pastebėti, kad pasiekti ką nors, kaip čia apibrėžta, gali būti visiškai neįmanoma, atsižvelgiant į mūsų pasaulyje egzistuojančius šališkus dalykus. Tai yra tiesa! Pasaulis, kuriame gyvename, kartu su visais duomenimis, surinktais iš įvykių šiame pasaulyje, priklauso nuo daugelio istorinių ir statistinių paklaidų. Tai iš tikrųjų sumažina pasitikėjimą, kad vieną dieną bus visiškai sumažintas šališkumo poveikis nuspėjamiesiems modeliams, parengtiems remiantis tokiais „šališkais“ duomenimis. Tačiau naudojant įvairius metodus galima bandyti sumažinti šališkumo poveikį. Tokiu atveju likusioje šio (-ių) tinklaraščio įrašo dalyje vartojama terminija bus nukreipta link šališkumo poveikio sumažinimo, o ne visiško jo sušvelninimo.

Gerai! Taigi dabar, kai buvo iškelta idėja, kas yra šališkumas ir kaip galima būtų įvertinti jo egzistavimą; Tačiau, jei norime tinkamai išspręsti problemą, turime žinoti, iš kur kyla visi šie šališkumas.

Supratimas apie šaltinius ir tipus

Esami tyrimai suteikia vertingų įžvalgų apie įvairius mašininio mokymosi šališkumo tipus. Kaip Mehrabi ir kt. al. (2019 m.) pradėta skirstyti mašininio mokymosi paklaidas, šališkumą galima suskirstyti į 3 pagrindines kategorijas. Būtent iš:

  • Duomenys į algoritmą: kategorija, apimanti paklaidas, kylančias iš pačių duomenų. Tai gali būti dėl prasto duomenų rinkimo, įgimto pasaulio šališkumo ir pan.
  • Algoritmas vartotojui: kategorija, kurioje dėmesys sutelkiamas į paklaidas, kylančias dėl algoritmų dizaino ir funkcionalumo. Ji apima tai, kaip algoritmai gali interpretuoti, pasverti arba apsvarstyti tam tikrus duomenų taškus prieš kitus, o tai gali lemti šališkus rezultatus.
  • Naudotojas duomenims: susijęs su šališkumu, atsirandančiu dėl vartotojo sąveikos su sistema. Tai, kaip vartotojai įveda duomenis, jiems būdingas šališkumas ar net pasitikėjimas sistemos rezultatais gali turėti įtakos rezultatams.
grafikas

1 pav. Duomenų gavybos CRISP-DM sistemos vizualizacija; dažniausiai naudojamas duomenų gavyboje ir yra susijęs su etapų, kuriuose gali atsirasti šališkumas, nustatymo procesui.

Nors pavadinimai rodo šališkumo formą, vis tiek gali kilti klausimų dėl šališkumo tipų, kuriuos galima suskirstyti į kategorijas pagal šiuos bendruosius terminus. Skaitytojų entuziastams pateikėme nuorodas į tam tikrą literatūrą, susijusią su šia terminija ir klasifikacija. Paprastumo sumetimais šiame tinklaraščio įraše apžvelgsime keletą pasirinktų paklaidų, kurios yra svarbios situacijai (beveik visi jie priklauso algoritmo kategorijoms). Konkretūs šališkumo tipai yra tokie:

  • Istorinis šališkumas: duomenims būdingas šališkumo tipas, kurį sukelia natūralus šališkumas, egzistuojantis pasaulyje įvairiose socialinėse grupėse ir apskritai visuomenėje. Būtent dėl ​​šių duomenų prigimties pasaulyje jų negalima sušvelninti įvairiomis atrankos ir funkcijų atrankos priemonėmis.
  • Matavimo poslinkis ir reprezentacijos poslinkis: šie du glaudžiai susiję poslinkiai atsiranda, kai skirtinguose duomenų rinkinio pogrupiuose yra nevienodas „palankių“ rezultatų kiekis. Todėl tokio tipo šališkumas gali iškreipti nuspėjamųjų modelių rezultatus
  • Algoritminis poslinkis: poslinkis, susijęs tik su naudojamu algoritmu. Kaip taip pat pastebėta atliktų bandymų metu (išsamiau aprašyta įraše), tokio tipo šališkumas gali turėti didžiulį poveikį tam tikro algoritmo teisingumui.

Šie pagrindiniai supratimai apie mašininio mokymosi šališkumą bus naudojami siekiant veiksmingiau išspręsti problemą vėlesniuose pranešimuose.

Baigiamosios mintys

Tyrinėdami dirbtinio intelekto šališkumą, mes nušvietėme gilias jo pasekmes mūsų vis labiau DI kuriamam pasauliui. Nuo realaus pasaulio pavyzdžių, tokių kaip Olandijos vaikų gerovės skandalas, iki sudėtingų šališkumo kategorijų ir tipų niuansų, akivaizdu, kad šališkumo atpažinimas ir supratimas yra svarbiausia.

Nors šališkumo keliami iššūkiai – nesvarbu, ar jie būtų istoriniai, ar algoritminiai, ar dėl vartotojo – yra reikšmingi, jie nėra neįveikiami. Tvirtai suvokdami šališkumo kilmę ir apraiškas, esame geriau pasirengę juos spręsti. Tačiau pripažinimas ir supratimas yra tik išeities taškai.

Toliau eidami į priekį šioje serijoje, kitas dėmesys bus skiriamas mūsų turimiems apčiuopiamiems įrankiams ir sistemoms. Kaip išmatuojame AI modelių šališkumo mastą? Ir dar svarbiau, kaip sumažinti jo poveikį? Tai yra neatidėliotini klausimai, į kuriuos gilinsimės toliau, užtikrindami, kad dirbtinis intelektas ir toliau vystytųsi teisinga ir efektyvia kryptimi.

besišypsančių žmonių grupė

Duomenys yra sintetiniai, bet mūsų komanda tikra!

Susisiekite su Syntho ir vienas iš mūsų ekspertų susisieks su jumis šviesos greičiu, kad ištirtų sintetinių duomenų vertę!