Ang Dili Makita nga Sala sa AI: Pag-abli sa Bias Sulod

Bias nga serye sa blog: bahin 1

Pasiuna

Sa atong kalibutan sa nagkadaghang artipisyal nga mga porma sa paniktik, ang mga makina nga gitahasan sa paghimo sa komplikadong mga desisyon nahimong mas ug mas kaylap. Adunay usa ka nagtubo nga lawas sa literatura nga nagpakita sa paggamit sa AI sa lain-laing mga dominyo sama sa Negosyo, high-stake nga pagdesisyon, ug sa miaging pipila ka tuig sa medikal nga sektor. Uban niining nagkadako nga pagkaylap, bisan pa, ang mga tawo nakamatikod bahin sa mga kalagmitan sa giingon nga mga sistema; Sa ato pa, samtang kay kinaiyanhon nga gidesinyo aron lunsay mosunod sa mga sumbanan sa datos, nagpakita sila og mga timailhan sa pagpihig, sa diwa nga ang lain-laing seksista ug diskriminasyon nga kinaiya mahimong maobserbahan. Ang bag-o lang European AI Act, nagkobre usab sa butang sa maong pagpihig ug nagbutang ug pundasyon sa pagsulbad sa mga problema nga nalangkit niini. 

Sa tibuok katuigan sa teknikal nga dokumentasyon, ang mga tawo migamit sa termino nga "bias" sa paghulagway niining hiwi nga matang sa kinaiya ngadto sa pipila ka mga demograpiko; usa ka pulong kansang kahulogan nagkadaiya, nga nagpahinabog kalibog ug nagpakomplikado sa buluhaton sa pagsulbad niini.

Kini nga artikulo mao ang una sa usa ka serye sa mga post sa blog nga naglangkob sa hilisgutan sa bias. Niini nga serye, tumong namo nga mahatagan ka ug klaro, matunaw nga pagsabot sa bias sa AI. Magpaila mi og mga paagi sa pagsukod ug pagpamenos sa bias ug pag-usisa sa papel sa sintetikong datos niini nga dalan paingon sa mas patas nga mga sistema. Hatagan ka usab namon og usa ka pagtan-aw kung giunsa ang Syntho, usa ka nanguna nga magdudula sa paghimo og sintetikong datos, makatampo niini nga paningkamot. Mao nga, bisan kung ikaw usa ka practitioner nga nangita alang sa mga aksyon nga panabut o gusto lang bahin sa kini nga hilisgutan, naa ka sa husto nga lugar.

Bias in Action: Usa ka Real-World Example

Mahimong maghunahuna ka, "Kini nga bias sa AI hinungdanon tanan, apan unsa ang gipasabut niini alang kanako, alang sa ordinaryong mga tawo?" Ang tinuod mao, ang epekto dako kaayo, kasagaran dili makita apan kusog. Ang pagpihig sa AI dili usa ka konsepto sa akademiko; kini usa ka tinuod nga kalibutan nga problema nga adunay seryoso nga mga sangputanan.

Himoa nga pananglitan ang Dutch child welfare scandal. Ang automated nga sistema, kuno usa ka himan nga gihimo aron makamugna og patas ug episyente nga mga resulta nga adunay gamay nga interbensyon sa tawo, gipihig. Sayop nga gimarkahan niini ang libu-libo nga mga ginikanan alang sa pagpanglimbong base sa sayup nga datos ug mga pangagpas. Ang resulta? Ang mga pamilya nga nahulog sa kagubot, personal nga reputasyon nadaot, ug pinansyal nga kalisud, tanan tungod sa mga pagpihig sa usa ka AI System. Kini ang mga pananglitan nga sama niini nga nagpasiugda sa pagkadinalian sa pagsulbad sa bias sa AI.

mga tawo nga nagprotesta

Apan dili ta mohunong diha. Kini nga panghitabo dili usa ka hilit nga kaso sa bias nga nagpahinabog kadaot. Ang epekto sa bias sa AI moabot sa tanang suok sa atong kinabuhi. Gikan sa kung kinsa ang gisuholan alang sa usa ka trabaho, kung kinsa ang naaprobahan alang sa usa ka pautang, hangtod sa kung kinsa ang nakadawat kung unsang klase nga pagtambal - ang mga bias nga AI nga sistema mahimo’g magpadayon sa mga naglungtad nga dili managsama ug makahimo mga bag-o.

Hunahunaa kini: ang usa ka sistema sa AI nga gibansay sa mapihigon nga datos sa kasaysayan mahimong makalimud sa usa ka kwalipikado nga kandidato nga usa ka trabaho tungod lamang sa ilang gender o etnisidad. O ang usa ka mapihigon nga sistema sa AI mahimong magdumili sa usa ka pautang sa usa ka takus nga kandidato tungod sa ilang postcode. Dili lang kini hypothetical nga mga senaryo; kini nahitabo karon.

Ang espesipikong mga matang sa biases, sama sa Historical Bias ug Measurement Bias, mosangpot sa maong sayop nga mga desisyon. Naa sila sa mga datos, nakagamot pag-ayo sa mga pagpihig sa katilingban, ug gipakita sa dili patas nga sangputanan sa lainlaing mga grupo sa demograpiko. Mahimo nilang balihon ang mga desisyon sa mga predictive nga modelo ug moresulta sa dili patas nga pagtratar.

Sa dako nga laraw sa mga butang, ang bias sa AI mahimong molihok ingon usa ka hilom nga impluwensyado, maliputon nga naghulma sa atong katilingban ug sa atong kinabuhi, kasagaran sa mga paagi nga wala naton nahibal-an. Kining tanan nga gihisgotan sa ibabaw nga mga punto mahimong motultol kanimo sa pagpangutana ngano nga wala’y gihimo nga mga aksyon aron mahunong, ug kung mahimo ba kini.

Sa tinuud, sa mga bag-ong pag-uswag sa teknolohiya nahimo nga labi ka dali nga masulbad ang ingon nga problema. Ang unang lakang sa pagsulbad niini nga problema, bisan pa, mao ang pagsabut ug pag-ila sa pagkaanaa ug epekto niini. Sa pagkakaron, ang pag-ila sa pagkaanaa niini nahimo na, nga nagbilin sa butang sa "pagsabot" nga dili pa klaro. 

Pagsabot sa Bias

Samtang ang orihinal nga kahulugan sa bias nga gipresentar sa Diksyonaryo sa Cambridge wala mahisalaag kaayo gikan sa nag-unang katuyoan sa pulong ingon nga kini may kalabutan sa AI, daghang lain-laing mga interpretasyon ang pagahimoon bisan niining singular nga kahulugan. Mga taxonomy, sama sa gipresentar sa mga tigdukiduki sama sa Hellström et al (2020) ug Kliegr (2021), paghatag og mas lawom nga pagsabot sa kahulugan sa bias. Ang usa ka yano nga pagtan-aw niini nga mga papel magpadayag, bisan pa, nga ang usa ka dako nga pagkunhod sa kahulugan sa termino gikinahanglan aron epektibo nga masulbad ang problema. 

Samtang ang usa ka pagbag-o sa mga panghitabo, aron sa labing maayo nga paghubit ug pagpahayag sa kahulogan sa pagpihig mas maayo nga mahibal-an sa usa ang kaatbang, kana mao ang Pagkapatas. 

Paghubit sa Pagkamatarong 

Ingon nga kini gihubit sa lain-laing mga bag-o nga literatura sama sa Castelnovo ug uban pa. (2022), ang kaangayan mahimong i-elaborate sa paghatag og pagsabot sa termino nga potensyal nga luna. Ingon nga kini anaa, ang potensyal nga luna (PS) nagtumong sa gidak-on sa mga kapabilidad ug kahibalo sa usa ka indibidwal bisan pa sa ilang pagkasakop sa usa ka demograpikong grupo. Gihatag kini nga depinisyon sa konsepto sa PS, dali nga mahulagway ang pagkapatas nga managsama nga pagtratar tali sa duha ka mga indibidwal nga managsama ang PS, bisan pa sa ilang makita ug tinago nga mga kalainan sa mga parameter nga nag-aghat sa pagpihig (sama sa rasa, edad, o gender). Ang bisan unsang diversion gikan sa kini nga kahulugan, gitawag usab nga Pagkaparehas sa mga Oportunidad, usa ka tin-aw nga timailhan sa pagpihig ug kinahanglan nga dugang nga imbestigasyon.  

Ang mga practitioner taliwala sa mga magbabasa tingali makamatikod nga ang pagkab-ot sa usa ka butang nga gipasabut dinhi mahimong hingpit nga imposible tungod sa kinaiyanhon nga mga pagpihig nga anaa sa atong kalibutan. Tinuod na! Ang kalibutan nga atong gipuy-an, uban sa tanang datos nga nakolekta gikan sa mga panghitabo niining kalibutana, kay naa sa daghang kasaysayan ug estadistika nga bias. Kini, sa tinuud, nagpamenos sa pagsalig sa usa ka adlaw nga hingpit nga makunhuran ang mga epekto sa bias sa mga predictive nga modelo nga gibansay sa ingon nga "biased" nga datos. Bisan pa, pinaagi sa paggamit sa lainlaing mga pamaagi, mahimo nimong sulayan nga maminusan ang mga epekto sa bias. Ingon niini ang kahimtang, ang terminolohiya nga gigamit sa nahabilin sa kini nga (mga) post sa blog magbalhin padulong sa ideya nga maminusan ang epekto sa pagpihig kaysa hingpit nga maminusan kini.

Okay! Busa karon nga ang usa ka ideya nga gidala sa gawas kon unsa ang pagpihig ug sa unsa nga paagi nga ang usa ka potensyal nga pagtimbang-timbang sa iyang paglungtad; Kung gusto naton nga atubangon ang problema sa husto, bisan pa, kinahanglan naton mahibal-an kung diin gikan ang tanan nga kini nga mga pagpihig.

Pagsabut sa mga Tinubdan ug mga tipo

Ang kasamtangan nga panukiduki naghatag og bililhong mga panabut sa lain-laing mga matang sa biases sa machine learning. Ingon Mehrabi et. al. (2019) Nagpadayon sa pagbahin sa mga bias sa pagkat-on sa makina, mahimo nga bahinon sa usa ang mga bias sa 3 ka dagkong mga kategorya. Nga mao ang sa:

  • Data sa Algorithm: usa ka kategorya nga naglangkob sa mga bias nga naggikan sa datos mismo. Mahimo kana tungod sa dili maayo nga pagkolekta sa datos, mga kinaiyanhon nga pagpihig nga naglungtad sa kalibutan, ug uban pa.
  • Algorithm sa Gumagamit: usa ka kategorya nga nagpunting sa mga bias nga naggikan sa disenyo ug gamit sa mga algorithm. Naglakip kini kung giunsa paghubad, pagtimbang, o pagkonsiderar ang mga algorithm sa pipila nga mga punto sa datos sa uban, nga mahimong mosangput sa mga sangputanan.
  • Gumagamit sa Data: may kalabotan sa mga pagpihig nga naggikan sa interaksyon sa tiggamit sa sistema. Ang paagi diin ang mga tiggamit nag-input sa datos, ang ilang kinaiyanhon nga mga bias, o bisan ang ilang pagsalig sa mga output sa sistema mahimong makaimpluwensya sa mga sangputanan.
graph

Figure 1: Usa ka visualization sa CRISP-DM framework alang sa data mining; kasagarang gigamit sa data mining ug may kalabutan sa proseso sa pag-ila sa mga yugto diin ang pagpihig mahimong mahitabo.

Samtang ang mga ngalan nagpaila sa porma sa pagpihig, ang usa mahimo nga adunay mga pangutana bahin sa mga tipo sa mga bias nga mahimo’g ma-categorize sa ilawom sa kini nga mga payong nga termino. Alang sa mga mahiligon sa among mga magbabasa, naghatag kami mga link sa pipila nga mga literatura nga may kalabotan sa kini nga terminolohiya ug klasipikasyon. Alang sa kayano sa kini nga post sa blog, tabonan namon ang pipila ka mga pinili nga bias nga may kalabutan sa sitwasyon (Halos tanan niini anaa sa datos sa kategorya sa algorithm). Ang piho nga mga matang sa bias mao ang mosunod:

  • Historical Bias: Usa ka matang sa pagpihig nga kinaiyanhon sa mga datos nga gipahinabo sa natural nga mga pagpihig nga anaa sa kalibutan sa lain-laing mga grupo sa katilingban ug katilingban sa kinatibuk-an. Tungod kini sa pagkaanaa niini nga datos sa kalibutan nga dili kini maminusan pinaagi sa lainlaing mga paagi sa sampling ug pagpili sa bahin.
  • Measurement Bias & Representation Bias: Kining duha ka suod nga relasyon nga bias mahitabo kung ang lain-laing mga subgroup sa dataset adunay dili patas nga kantidad sa "paborable" nga mga resulta. Kini nga matang sa pagpihig busa mahimo’g mabag-o ang sangputanan sa mga predictive nga mga modelo
  • Algorithmic Bias: Bias nga pulos nalangkit sa algorithm nga gigamit. Sama sa naobserbahan usab sa mga pagsulay nga gipadagan (elaborate sa dugang sa post), kini nga matang sa bias mahimong adunay dako nga epekto sa kaangayan sa usa ka gihatag nga algorithm.

Kini nga mga sukaranan nga pagsabut sa bias sa pagkat-on sa makina gamiton aron masulbad ang problema nga mas epektibo sa ulahi nga mga post.

Katapusan nga mga Hunahuna

Niini nga eksplorasyon sa bias sulod sa artipisyal nga paniktik, among gipadan-ag ang lawom nga mga implikasyon nga gihuptan niini sa among nagkadako nga AI-driven nga kalibutan. Gikan sa tinuod nga kalibutan nga mga pananglitan sama sa Dutch child welfare scandal ngadto sa makuti nga mga nuances sa bias nga mga kategoriya ug mga tipo, dayag nga ang pag-ila ug pagsabot sa bias mao ang labing importante.

Samtang ang mga hagit nga gipahinabo sa mga pagpihig - kung kini makasaysayanon, algorithmic, o giaghat sa gumagamit - hinungdanon, dili kini mabuntog. Uban sa usa ka lig-on nga pagsabot sa mga sinugdanan ug mga pagpakita sa pagpihig, kita mas nasangkapan sa pagsulbad niini. Bisan pa, ang pag-ila ug pagsabut mao lamang ang mga punto sa pagsugod.

Samtang nagpadayon kami sa kini nga serye, ang among sunod nga pagtutok mao ang mahikap nga mga himan ug mga balangkas nga among magamit. Giunsa nato pagsukod ang gilapdon sa bias sa mga modelo sa AI? Ug labaw sa tanan, unsaon nato pagpamenos ang epekto niini? Kini ang mga dinalian nga mga pangutana nga atong susihon sa sunod, pagsiguro nga samtang ang AI nagpadayon sa pag-uswag, kini nahimo sa usa ka direksyon nga parehas nga patas ug pasundayag.

grupo sa mga tawo nga nagpahiyom

Sintetiko ang datos, apan tinuod ang among team!

Pakigsulti kang Syntho ug usa sa among mga eksperto makigsulti kanimo sa gikusgon sa kahayag aron masusi ang kantidad sa sintetikong datos!