AIren errua ikusi ezina: barruko alborapena argitzea

Bias blog-saila: 1. zatia

Sarrera

Adimen forma gero eta artifizialagoak diren gure munduan, erabaki konplexuak hartzeko ardura duten makinak gero eta nagusiagoak dira. Gero eta gehiago dago AIaren erabilera adierazten duen literatura-esparrua hainbat domeinutan, hala nola negozioetan, erabakiak hartzeko apustu handian eta azken urteotan medikuaren sektorean. Prebalentzia gero eta handiagoarekin, ordea, jendeak joera kezkagarriak nabaritu ditu sistema horietan; Hau da, berez datuetan eredu hutsak jarraitzeko diseinatuta dauden arren, aurreiritzi zantzuak erakutsi dituzte, hainbat jokabide sexista eta diskriminatzaile antzeman daitezkeen zentzuan. Azkena AIren Europako Legea, aurreiritzi horien gaia ere nahiko zabal jorratzen du eta harekin lotutako arazoei aurre egiteko oinarria ezartzen du. 

Dokumentazio teknikoaren urteetan zehar, jendeak "alborapen" terminoa erabili izan du demografia jakin batzuekiko jokabide oker hori deskribatzeko; esanahia aldatzen den hitza, nahasmena eraginez eta jorratzeko lana zailduz.

Artikulu hau alborapenaren gaia lantzen duten blog-argitalpenen lehenengoa da. Serie honetan, AIren alborapenaren ulermen argia eta digerigarria ematea izango dugu helburu. Alborapena neurtzeko eta minimizatzeko moduak aurkeztuko ditugu eta datu sintetikoek sistema justuagoetarako bide honetan duten zeregina aztertuko dugu. Era berean, Synthok, datu sintetikoen sorreran liderra den jokalariak, ahalegin horretan nola lagundu dezakeen aztertzen dizugu. Beraz, praktikatzaile bat bazara, informazio eragileak bilatzen ari zaren edo gai honi buruz jakin-mina duzun, leku egokian zaude.

Alborapena ekintzan: mundu errealeko adibidea

Baliteke galdetzen ari zarena: "AIren alborapen hau garrantzitsua da, baina zer esan nahi du niretzat, jende arruntarentzat?" Egia esan, eragina zabala da, askotan ikusezina baina indartsua. AIren alborapena ez da kontzeptu akademiko hutsa; mundu errealeko arazo bat da, ondorio larriak dituena.

Hartu Holandako haurren ongizatearen eskandalua adibide gisa. Sistema automatizatua, ustez giza esku-hartze minimoarekin emaitza justu eta eraginkorrak sortzeko sortutako tresna, alboratuta zegoen. Oker markatu zituen milaka guraso iruzurragatik, datu eta hipotesi akatsetan oinarrituta. Emaitza? Nahasmenduan sartutako familiak, ospe pertsonala kaltetuta eta zailtasun ekonomikoak, guztiak AI Sistema baten alborapenengatik. Horrelako adibideek AIren alborapenari aurre egiteko premia nabarmentzen dute.

jendea protestan

Baina ez gaitezen hor gelditu. Gertaera hau ez da hondamena eragiten duen alborapen kasu isolatu bat. AIren alborapenaren eragina gure bizitzako txoko guztietara hedatzen da. Lan baterako kontratatzen denetik, mailegu baterako onarpena jasotzen duenetik, zein tratamendu medikoa jasotzen duen arte: AI sistema alboratuak dauden desberdintasunak betikotu eta berriak sor ditzakete.

Kontuan izan hau: datu historiko alboragarrietan trebatutako AI sistema batek ondo kualifikatutako hautagai bati lanpostu bat ukatu diezaioke bere genero edo etniagatik soilik. Edo alboratutako AI sistema batek mailegu bat ukatu diezaioke merezi duen hautagai bati posta kodea dela eta. Hauek ez dira eszenatoki hipotetikoak soilik; oraintxe gertatzen ari dira.

Alborapen mota zehatzek, hala nola Alborapen historikoa eta Neurketa Alborapena, horrelako erabaki akatsak ekartzen dituzte. Datuetan berezkoak dira, gizarte-alborapenetan oso errotuta daude eta talde demografiko ezberdinen arteko emaitza desorekatuetan islatzen dira. Iragarpen-ereduen erabakiak okertu ditzakete eta tratu bidegabea eragin dezakete.

Gauzen eskema handian, AIaren alborapenak eragile isil gisa joka dezake, gure gizartea eta gure bizitza sotilki moldatuz, askotan konturatzen ez garen moduan. Aipatutako puntu horiek guztiek zalantzan jar dezakete zergatik ez diren ekintzak egin gelditzeko, eta posible den ere.

Izan ere, aurrerapen teknologiko berriekin gero eta eskuragarriagoa da arazo horri aurre egitea. Arazo honi aurre egiteko lehen urratsa, ordea, bere existentzia eta eragina ulertzea eta aitortzea da. Oraingoz, bere existentziaren aitorpena sortu da, “ulertzearen” kontua oraindik nahiko lausoa utziz. 

Alborapena ulertzea

Alborapenaren jatorrizko definizioa, berriz, Cambridgeko hiztegia ez da hitzaren helburu nagusitik gehiegi urruntzen AIri dagokionean, interpretazio ezberdin asko egin behar dira definizio berezi hori ere. Taxonomiak, esaterako, ikertzaileek aurkeztutakoak Hellström et al (2020) Kliegr (2021), alborapenaren definizioari buruzko ikuspegi sakonagoa eman. Artikulu hauei begirada soil batek agerian utziko du, ordea, terminoaren definizioaren murrizketa handia behar dela arazoari modu eraginkorrean aurre egiteko. 

Gertaeren aldaketa izanik ere, alborapenaren esanahia hobekien definitzeko eta helarazteko hobeto defini daiteke kontrakoa, hau da, Zuzentasuna. 

Zuzentasuna definitzea 

Azkenaldian hainbat literaturatan definitzen den bezala, esaterako Castelnovo et al. (2022), zuzentasuna landu daiteke espazio potentzial terminoa ulertuta. Dagoen bezala, espazio potentzialak (PS) gizabanakoaren gaitasun eta ezagutzaren hedadurari egiten dio erreferentzia, talde demografiko jakin bateko kide izan gabe. PS kontzeptuaren definizio hori kontuan hartuta, zuzentasuna erraz defini daiteke PS berdineko bi gizabanakoen arteko tratu-berdintasuna dela, alborapen-parametroetan (adibidez, arraza, adina edo sexua, esaterako) dauden aldeak (arraza, adina edo sexua, esaterako) ezkutuan dauden aldeak kontuan hartu gabe. Definizio honetatik desbideratzeak, aukera-berdintasuna ere deitzen zaiona, alborapenaren adierazgarri argia da eta ikerketa gehiago merezi du.  

Irakurleen artean adituek ohartuko litzaidake hemen definitutako zerbait lortzea guztiz ezinezkoa izan daitekeela gure munduan dauden berezko joerak kontuan hartuta. Hori egia da! Bizi garen mundua, mundu honetako agerraldietatik jasotako datu guztiekin batera, alborapen historiko eta estatistiko askoren menpe dago. Horrek, hain zuzen ere, datu "alboragarrietan" lantzen diren eredu prediktiboetan alborapenaren inpaktuak guztiz arintzeko konfiantza murrizten du. Hala ere, hainbat metodo erabiliz, alborapenaren inpaktuak gutxitzen saia daiteke. Hau horrela izanda, blogeko gainerako argitalpenetan erabilitako terminologia alborapenaren eragina gutxitzeko ideiara aldatuko da guztiz arindu beharrean.

Ados! Beraz, orain, alborapena zer den eta bere existentzia nola ebaluatu litekeen ideia bat atera da; Arazoari behar bezala aurre egin nahi badiogu, ordea, alborapen horiek guztiak nondik datozen jakin behar dugu.

Iturriak eta motak ulertzea

Dauden ikerketek ikaskuntza automatikoaren alborapen mota desberdinei buruzko informazio baliotsua eskaintzen dute. As Mehrabi et. al. (2019) Ikaskuntza automatikoan alborapenak banatzen jarraitu dute, alborapenak 3 kategoria nagusitan bana daitezke. Hauek, hain zuzen ere:

  • Data to Algorithm: datuetatik bertatik sortutako alborapenak biltzen dituen kategoria. Datu-bilketa eskasaren, munduan dauden berezko alborapenen etab.
  • Algorithm to User: algoritmoen diseinutik eta funtzionaltasunetik eratorritako alborapenetan zentratzen den kategoria. Algoritmoek datu-puntu batzuk besteen gainetik nola interpretatu, haztatu edo nola kontuan hartu ditzaketen barne hartzen du, eta horrek emaitza alboratuak sor ditzake.
  • Erabiltzailetik datuetara: erabiltzaileek sistemarekin duten interakziotik sortzen diren alborapenei dagokie. Erabiltzaileek datuak sartzeko moduak, berezko alborapenak edo sistemaren irteeretan duten konfiantzak ere eragina izan dezakete emaitzetan.
grafikoan

1. irudia: CRISP-DM markoaren bistaratzea datu-meatzaritzarako; datu-meatzaritzan normalean erabiltzen da eta alborapenak sor daitezkeen faseak identifikatzeko prozesuari dagozkionak.

Izenak alborapen formaren adierazgarri diren arren, oraindik ere zalantzak izan ditzake aterki termino hauen arabera sailka ditzakeen alborapen motei buruz. Gure irakurleen artean zaletuentzat, terminologia eta sailkapen honekin lotutako literatura batzuen estekak eskaini ditugu. Blogeko argitalpen honetan sinpletasunaren mesedetan, egoerari dagozkion zenbait alborapen hautagarri batzuk landuko ditugu (ia guztiak algoritmorako datuen kategoriakoak). Alborapen mota zehatzak hauek dira:

  • Alborapen historikoa: Gizarte talde ezberdinetan eta gizartean orokorrean munduan dauden alborapen naturalek eragindako datuei dagokien alborapen mota. Datu hauek munduan duten inherentziagatik ezin da laginketa eta ezaugarriak aukeratzeko hainbat bideren bidez arindu.
  • Neurketa-alborapena eta irudikapen-alborapena: lotura estua duten bi alborapen hauek datu-multzoaren azpitalde ezberdinek emaitza "alde on" kopuru desberdina dutenean gertatzen dira. Alborapen mota honek, beraz, eredu prediktiboen emaitza okertu dezake
  • Alborapen algoritmikoa: Erabiltzen ari den algoritmoari soilik lotutako alborapena. Probetan ere ikusi den bezala (argitalpenean gehiago landua), alborapen mota honek sekulako eragina izan dezake algoritmo jakin baten bidezkotasunean.

Ikaskuntza automatikoaren alborapenaren oinarrizko ulermen hauek arazoari modu eraginkorragoan aurre egiteko erabiliko dira ondorengo argitalpenetan.

Final Pensamientos

Adimen artifizialaren alborapenaren arakatze honetan, gero eta AI bultzatutako gure munduan dituen inplikazio sakonak argitu ditugu. Holandako haurren ongizatearen eskandalua bezalako mundu errealeko adibideetatik hasi eta alborapen kategorien eta moten ñabardura korapilatsuetaraino, nabaria da alborapena ezagutzea eta ulertzea funtsezkoa dela.

Alborapenek planteatzen dituzten erronkak —historikoak, algoritmoak edo erabiltzaileek eragindakoak izan— esanguratsuak diren arren, ez dira gaindiezinak. Alborapenaren jatorria eta adierazpenak irmoki jabetuta, hobeto gaude horiei aurre egiteko. Hala ere, aintzatespena eta ulermena abiapuntuak baino ez dira.

Serie honetan aurrera goazen heinean, gure hurrengo arreta gure eskura ditugun tresna eta esparru ukigarrietan izango da. Nola neurtzen dugu alborapenaren neurria AI ereduetan? Eta are garrantzitsuagoa dena, nola murriztuko dugu haren eragina? Hauek dira hurrengoan sakonduko ditugun galdera nagusiak, AI-ak eboluzionatzen jarraitzen duen heinean, bidezkoa eta eraginkorra den norabidean egiten duela ziurtatuz.

jende taldea irribarrez

Datuak sintetikoak dira, baina gure taldea benetakoa da!

Jarri harremanetan Synthorekin eta gure adituetako bat zurekin harremanetan jarriko da argiaren abiaduran datu sintetikoen balioa aztertzeko!