Ħati li ma tidhirx ta' l-AI: Niżżel il-preġudizzju ġewwa

Serje tal-blog bias: parti 1

introduzzjoni

Fid-dinja tagħna ta 'forom dejjem aktar artifiċjali ta' intelliġenza, magni li huma inkarigati li jieħdu deċiżjonijiet kumplessi qed isiru dejjem aktar prevalenti. Hemm korp dejjem jikber ta 'letteratura li tindika l-użu tal-AI f'diversi oqsma bħan-Negozju, it-teħid ta' deċiżjonijiet b'riskju kbir, u matul l-aħħar ftit snin fis-settur mediku. B'din il-prevalenza dejjem tikber, madankollu, in-nies innutaw tendenzi dwar l-imsemmija sistemi; Jiġifieri, filwaqt li huma intrinsikament imfassla biex isegwu purament xejriet fid-data, huma wrew sinjali ta’ preġudizzju, fis-sens li jistgħu jiġu osservati diversi mġieba sessista u diskriminatorja. L-aħħar Att Ewropew dwar l-AI, ikopri wkoll il-kwistjoni ta' tali preġudizzju b'mod pjuttost estensiv u jistabbilixxi pedament biex jiġu ttrattati l-problemi assoċjati miegħu. 

Matul is-snin ta 'dokumentazzjoni teknika, in-nies kellhom it-tendenza li jużaw it-terminu "preġudizzju" biex jiddeskrivu dan it-tip ta' mġiba distorta lejn ċerti demografiji; kelma li t-tifsira tagħha tvarja, li tikkawża konfużjoni u tikkomplika l-kompitu li tindirizzaha.

Dan l-artikolu huwa l-ewwel minn serje ta 'blog posts li jkopru s-suġġett tal-preġudizzju. F'din is-serje, aħna ser nimmiraw li nagħtuk fehim ċar u diġestibbli tal-preġudizzju fl-AI. Se nintroduċu modi kif inkejlu u nnaqqsu l-preġudizzji u nesploraw ir-rwol tad-dejta sintetika f'din it-triq għal sistemi aktar ġusti. Aħna ser nagħtuk ukoll ħarsa lejn kif Syntho, attur ewlieni fil-ġenerazzjoni tad-dejta sintetika, jista 'jikkontribwixxi għal dan l-isforz. Allura, kemm jekk int prattikant li qed tfittex għarfien azzjonabbli jew sempliċement kurjuż dwar dan is-suġġett, int fil-post it-tajjeb.

Preġudizzju fl-Azzjoni: Eżempju tad-Dinja Reali

Forsi tkun qed tistaqsi, "Dan il-preġudizzju fl-AI huwa importanti kollu, imma xi jfisser għalija, għan-nies komuni?" Il-verità hija, l-impatt huwa wiesa ', ħafna drabi inviżibbli iżda qawwi. Il-preġudizzju fl-AI mhuwiex sempliċi kunċett akkademiku; hija problema fid-dinja reali b'konsegwenzi serji.

Ħu l-iskandlu Olandiż tal-benesseri tat-tfal bħala eżempju. Is-sistema awtomatizzata, allegatament għodda maħluqa biex tiġġenera riżultati ġusti u effiċjenti b'intervent uman minimu, kienet preġudikata. Hija indikat b'mod żbaljat eluf ta' ġenituri għal frodi bbażati fuq data u suppożizzjonijiet difettużi. Ir-riżultat? Familji mitfugħin f'taqlib, reputazzjoni personali mħassra, u tbatija finanzjarja, kollha minħabba preġudizzji f'Sistema AI. Huma eżempji bħal dawn li jenfasizzaw l-urġenza li jiġi indirizzat il-preġudizzju fl-IA.

nies jipprotestaw

Imma ejja ma nieqfux hemm. Dan l-inċident mhuwiex każ iżolat ta’ preġudizzju li qed jagħmel ħerba. L-impatt tal-preġudizzju fl-AI jestendi għall-irkejjen kollha tal-ħajja tagħna. Minn min jiġi impjegat għal impjieg, min jiġi approvat għal self, għal min jirċievi x'tip ta' trattament mediku - sistemi preġudikati tal-AI jistgħu jipperpetwaw l-inugwaljanzi eżistenti u joħolqu oħrajn ġodda.

Ikkunsidra dan: sistema ta' AI mħarrġa fuq data storika preġudikata tista' tiċħad kandidat kwalifikat tajjeb impjieg sempliċement minħabba s-sess jew l-etniċità tiegħu. Jew sistema AI preġudikata tista 'tiċħad self lil kandidat li ħaqqhom minħabba l-kodiċi postali tagħhom. Dawn mhumiex biss xenarji ipotetiċi; qed iseħħu bħalissa.

It-tipi speċifiċi ta 'preġudizzji, bħal Preġudizzju Storiku u Preġudizzju tal-Kejl, iwasslu għal deċiżjonijiet difettużi bħal dawn. Huma inerenti fid-dejta, għeruq sodi fil-preġudizzji tas-soċjetà, u riflessi fir-riżultati mhux ugwali fost gruppi demografiċi differenti. Jistgħu jxekklu d-deċiżjonijiet ta 'mudelli ta' tbassir u jirriżultaw fi trattament inġust.

Fl-iskema kbira tal-affarijiet, il-preġudizzju fl-AI jista 'jaġixxi bħala influwenzatur sieket, li jsawwar b'mod sottili s-soċjetà tagħna u ħajjitna, ħafna drabi b'modi li lanqas biss nirrealizzaw. Dawn il-punti kollha msemmija hawn fuq jistgħu jwassluk biex tistaqsi għaliex ma ttieħdux azzjonijiet biex tieqaf, u jekk hux possibbli.

Tabilħaqq, bl-avvanzi teknoloġiċi ġodda jsir dejjem aktar aċċessibbli biex tiġi ttrattata problema bħal din. L-ewwel pass biex tiġi indirizzata din il-problema, madankollu, huwa li wieħed jifhem u jirrikonoxxi l-eżistenza u l-impatt tagħha. Għalissa, inħoloq ir-rikonoxximent tal-eżistenza tiegħu, u ħalliet il-kwistjoni ta '"fehim" li għadha pjuttost vaga. 

Fehim Bias

Filwaqt li d-definizzjoni oriġinali tal-preġudizzju kif ippreżentata mill- Dizzjunarju Cambridge ma jitbiegħedx wisq mill-għan ewlieni tal-kelma peress li hija relatata mal-AI, għandhom isiru ħafna interpretazzjonijiet differenti anke ta 'din id-definizzjoni singular. Tassonomiji, bħal dawk ippreżentati minn riċerkaturi bħal Hellström et al (2020) u, Kliegr (2021), ipprovdi għarfien aktar profond tad-definizzjoni tal-preġudizzju. Ħarsa sempliċi lejn dawn id-dokumenti se tiżvela, madankollu, li tidjiq kbir tad-definizzjoni tat-terminu huwa meħtieġ biex tiġi indirizzata b'mod effettiv il-problema. 

Filwaqt li tkun bidla ta’ avvenimenti, sabiex tiddefinixxi u twassal bl-aħjar mod it-tifsira tal-preġudizzju wieħed jista’ jiddefinixxi aħjar l-oppost, jiġifieri l-Ekwità. 

Id-Definizzjoni tal-Ekwità 

Kif huwa definit f'diversi letteratura reċenti bħal Castelnovo et al. (2022), il-ġustizzja tista 'tiġi elaborata fuq meta wieħed jifhem it-terminu spazju potenzjali. Kif jeżisti, l-ispazju potenzjali (PS) jirreferi għall-firxa tal-kapaċitajiet u l-għarfien ta 'individwu irrispettivament mill-appartenenza tagħhom għal ċertu grupp demografiku. Minħabba din id-definizzjoni tal-kunċett ta 'PS, wieħed jista' faċilment jiddefinixxi l-ġustizzja bħala l-ugwaljanza ta 'trattament bejn żewġ individwi ta' PS ugwali, irrispettivament mid-differenzi osservabbli u moħbija tagħhom fil-parametri li jinduċu preġudizzju (bħal razza, età jew sess). Kwalunkwe devjazzjoni minn din id-definizzjoni, imsejħa wkoll Ugwaljanza ta' Opportunitajiet, hija indikazzjoni ċara ta' preġudizzju u jistħoqqilha aktar investigazzjoni.  

Il-prattikanti fost il-qarrejja jistgħu jinnutaw li l-kisba ta 'xi ħaġa kif definita hawn tista' tkun kompletament impossibbli minħabba l-preġudizzji inerenti li jeżistu fid-dinja tagħna. Dan huwa veru! Id-dinja li ngħixu fiha, flimkien mad-dejta kollha miġbura minn okkorrenzi f'din id-dinja, hija soġġetta għal ħafna preġudizzju storiku u statistiku. Dan, tabilħaqq, inaqqas il-kunfidenza li ġurnata waħda tittaffa bis-sħiħ l-impatti tal-preġudizzju fuq mudelli ta 'tbassir imħarrġa fuq tali data "preġudikata". Madankollu, permezz tal-użu ta 'metodi varji, wieħed jista' jipprova jimminimizza l-impatti tal-preġudizzju. Peress li dan huwa l-każ, it-terminoloġija użata fil-bqija ta 'din il-post(i) tal-blog se tinbidel lejn l-idea li jitnaqqas l-impatt tal-preġudizzju aktar milli ttaffih bis-sħiħ.

Okay! Allura issa li ħarġet idea ta 'x'inhi preġudizzju u kif wieħed jista' potenzjalment jevalwa l-eżistenza tiegħu; Jekk irridu nindirizzaw il-problema kif suppost, madankollu, irridu nkunu nafu minn fejn joriġinaw dawn il-preġudizzji kollha.

Fehim tas-Sorsi u t-tipi

Ir-riċerka eżistenti tipprovdi għarfien siewi dwar it-tipi differenti ta’ preġudizzji fit-tagħlim tal-magni. Kif Mehrabi et. al. (2019) ipproċedew biex jaqsmu l-preġudizzji fit-tagħlim tal-magni, wieħed jista 'jaqsam il-preġudizzji fi 3 kategoriji ewlenin. Jiġifieri dawk ta':

  • Data għall-Algoritmu: kategorija li tinkludi preġudizzji li joriġinaw mid-dejta nnifisha. Dan jista' jkun ikkawżat minn ġbir fqir ta' data, preġudizzji inerenti eżistenti fid-dinja, eċċ.
  • Algoritmu għall-Utent: kategorija li tiffoka fuq preġudizzji li joħorġu mid-disinn u l-funzjonalità tal-algoritmi. Jinkludi kif l-algoritmi jistgħu jinterpretaw, jiżnu, jew jikkunsidraw ċerti punti tad-dejta fuq oħrajn, li jistgħu jwasslu għal riżultati preġudikati.
  • Utent għad-Data: jappartjeni għal preġudizzji li jirriżultaw mill-interazzjoni tal-utent mas-sistema. Il-mod li bih l-utenti jdaħħlu d-dejta, il-preġudizzji inerenti tagħhom, jew saħansitra l-fiduċja tagħhom fl-outputs tas-sistema jistgħu jinfluwenzaw ir-riżultati.
grafu

Figura 1: Viżwalizzazzjoni tal-qafas CRISP-DM għat-tħaffir tad-dejta; użata komunement fit-tħaffir tad-dejta u rilevanti għall-proċess ta 'identifikazzjoni tal-istadji li fihom jista' jkun hemm preġudizzju.

Filwaqt li l-ismijiet huma indikattivi tal-forma ta 'preġudizzju, wieħed jista' xorta jkollu mistoqsijiet dwar it-tipi ta 'preġudizzji li wieħed jista' jikkategorizza taħt dawn it-termini umbrella. Għad-dilettanti fost il-qarrejja tagħna, ipprovdejna links għal xi letteratura relatata ma' din it-terminoloġija u l-klassifikazzjoni. Għal raġunijiet ta 'sempliċità f'dan il-post tal-blog, aħna se nkopru ftit preġudizzji magħżula li huma rilevanti għas-sitwazzjoni (Kważi kollha huma tal-kategorija data għall-algoritmu). It-tipi speċifiċi ta’ preġudizzji huma kif ġej:

  • Preġudizzju Storiku: Tip ta 'preġudizzju inerenti għad-dejta kkawżata mill-preġudizzji naturali eżistenti fid-dinja fi gruppi soċjali differenti u s-soċjetà b'mod ġenerali. Huwa minħabba l-inerenza ta 'din id-dejta fid-dinja li ma tistax tittaffa permezz ta' diversi mezzi ta 'teħid ta' kampjuni u għażla tal-karatteristiċi.
  • Preġudizzju tal-Kejl u Preġudizzju tar-Rappreżentanza: Dawn iż-żewġ preġudizzji relatati mill-qrib iseħħu meta s-sottogruppi differenti tas-sett tad-dejta jkun fihom ammonti mhux ugwali ta’ riżultati “favorevoli”. Dan it-tip ta 'preġudizzju għalhekk jista' jxekkel l-eżitu ta 'mudelli ta' tbassir
  • Preġudizzju algoritmiku: Preġudizzju purament relatat mal-algoritmu li qed jintuża. Kif osservat ukoll fit-testijiet li saru (elaborat aktar fil-post), dan it-tip ta 'preġudizzju jista' jkollu effett tremend fuq il-ġustizzja ta 'algoritmu partikolari.

Dan il-fehim fundamentali tal-preġudizzju fit-tagħlim tal-magni se jiġi utilizzat sabiex il-problema tiġi ttrattata b'mod aktar effettiv f'karigi aktar tard.

Ħsibijiet Finali

F'din l-esplorazzjoni tal-preġudizzju fl-intelliġenza artifiċjali, idawwalna l-implikazzjonijiet profondi li għandha fid-dinja tagħna dejjem aktar immexxija mill-AI. Minn eżempji tad-dinja reali bħall-iskandlu Olandiż tal-benesseri tat-tfal sal-sfumaturi kkomplikati ta 'kategoriji u tipi ta' preġudizzju, huwa evidenti li r-rikonoxximent u l-fehim tal-preġudizzju huwa importanti ħafna.

Filwaqt li l-isfidi maħluqa mill-preġudizzji — kemm jekk ikunu storiċi, algoritmiċi, jew indotti mill-utent — huma sinifikanti, mhumiex insormontabbli. B'ħakma soda fuq l-oriġini u l-manifestazzjonijiet tal-preġudizzju, aħna mgħammra aħjar biex nindirizzawhom. Madankollu, ir-rikonoxximent u l-fehim huma biss il-punti tat-tluq.

Hekk kif nimxu 'l quddiem f'din is-serje, l-enfasi li jmiss tagħna se tkun fuq l-għodod u l-oqfsa tanġibbli għad-dispożizzjoni tagħna. Kif inkejlu l-estent tal-preġudizzju fil-mudelli tal-AI? U aktar importanti, kif innaqqsu l-impatt tagħha? Dawn huma l-mistoqsijiet urġenti li ser nidħlu fihom li jmiss, filwaqt li niżguraw li hekk kif l-AI tkompli tevolvi, tagħmel dan f'direzzjoni li hija kemm ġusta kif ukoll performanta.

grupp ta’ nies jitbissem

Id-dejta hija sintetika, iżda t-tim tagħna huwa reali!

Ikkuntattja lil Syntho u wieħed mill-esperti tagħna se jagħmel kuntatt miegħek fil-veloċità tad-dawl biex jesplora l-valur tad-dejta sintetika!