Culprit Anweledig AI: Datrys y Tuedd O Fewn

Cyfres blog bias: rhan 1

Cyflwyniad

Yn ein byd o ffurfiau cynyddol artiffisial o ddeallusrwydd, mae peiriannau sydd â'r dasg o wneud penderfyniadau cymhleth yn dod yn fwyfwy cyffredin. Mae corff cynyddol o lenyddiaeth sy'n nodi'r defnydd o AI mewn amrywiol feysydd megis Busnes, gwneud penderfyniadau uchel eu cyfran, a thros yr ychydig flynyddoedd diwethaf yn y sector meddygol. Gyda'r mynychder cynyddol hwn, fodd bynnag, mae pobl wedi sylwi ar dueddiadau pryderus yn y systemau dywededig; Hynny yw, er eu bod wedi'u cynllunio'n gynhenid i ddilyn patrymau yn y data yn unig, maent wedi dangos arwyddion o ragfarn, yn yr ystyr y gellir arsylwi ar ymddygiad rhywiaethol a gwahaniaethol amrywiol. Y diweddar Deddf AI Ewropeaidd, hefyd yn ymdrin yn eithaf helaeth â rhagfarn o'r fath ac yn gosod sylfaen ar gyfer mynd i'r afael â phroblemau sy'n gysylltiedig ag ef.

Drwy gydol y blynyddoedd o ddogfennaeth dechnegol, mae pobl wedi tueddu i ddefnyddio’r term “rhagfarn” i ddisgrifio’r math hwn o ymddygiad gogwydd tuag at ddemograffeg benodol; gair y mae ei ystyr yn amrywio, gan achosi dryswch a chymhlethu'r dasg o fynd i'r afael ag ef.

Yr erthygl hon yw'r gyntaf mewn cyfres o bostiadau blog sy'n ymwneud â thuedd. Yn y gyfres hon, byddwn yn ceisio rhoi dealltwriaeth glir a threuliadwy i chi o ragfarn mewn AI. Byddwn yn cyflwyno ffyrdd o fesur a lleihau rhagfarn ac archwilio rôl data synthetig yn y llwybr hwn at systemau mwy teg. Byddwn hefyd yn rhoi cipolwg i chi ar sut y gall Syntho, chwaraewr blaenllaw ym maes cynhyrchu data synthetig, gyfrannu at yr ymdrech hon. Felly, p'un a ydych chi'n ymarferydd sy'n chwilio am fewnwelediadau gweithredadwy neu ddim ond yn chwilfrydig am y pwnc hwn, rydych chi yn y lle iawn.

Tuedd ar Waith: Enghraifft o Fyd Go Iawn

Efallai eich bod yn pendroni, “Mae'r duedd hon mewn AI yn holl bwysig, ond beth mae'n ei olygu i mi, i bobl gyffredin?” Y gwir yw, mae'r effaith yn bellgyrhaeddol, yn aml yn anweledig ond yn gryf. Nid cysyniad academaidd yn unig yw rhagfarn mewn AI; mae'n broblem yn y byd go iawn gyda chanlyniadau difrifol.

Cymerwch sgandal lles plant yr Iseldiroedd fel enghraifft. Roedd y system awtomataidd, sef offeryn a grëwyd i gynhyrchu canlyniadau teg ac effeithlon gydag ychydig iawn o ymyrraeth ddynol, yn rhagfarnllyd. Tynnodd sylw'n anghywir at filoedd o rieni am dwyll yn seiliedig ar ddata a thybiaethau diffygiol. Y canlyniad? Teuluoedd yn cael eu taflu i gythrwfl, enw da personol wedi'i niweidio, a chaledi ariannol, i gyd oherwydd rhagfarnau mewn System AI. Enghreifftiau fel hyn sy'n amlygu'r brys i fynd i'r afael â thuedd mewn AI.

Ffynhonnell: “Ouders iawndal toeslagenaffaire kan zomaar tot 2030 duren”, 2023. NOS

Ond gadewch i ni beidio â stopio yno. Nid yw'r digwyddiad hwn yn achos unigol o ragfarn sy'n llanastr. Mae effaith rhagfarn mewn AI yn ymestyn i bob cornel o'n bywydau. O bwy sy'n cael ei gyflogi am swydd, pwy sy'n cael ei gymeradwyo ar gyfer benthyciad, i bwy sy'n derbyn pa fath o driniaeth feddygol - gall systemau AI rhagfarnllyd barhau'r anghydraddoldebau presennol a chreu rhai newydd.

Ystyriwch hyn: gallai system Deallusrwydd Artiffisial sydd wedi’i hyfforddi ar ddata hanesyddol rhagfarnllyd wrthod swydd i ymgeisydd â chymwysterau da dim ond oherwydd eu rhyw neu ethnigrwydd. Neu fe allai system AI rhagfarnllyd wadu benthyciad i ymgeisydd haeddiannol oherwydd eu cod post. Nid senarios damcaniaethol yn unig yw’r rhain; maent yn digwydd ar hyn o bryd.

Mae'r mathau penodol o dueddiadau, megis Tuedd Hanesyddol a Thuedd Mesur, yn arwain at benderfyniadau mor ddiffygiol. Maent yn gynhenid yn y data, wedi'u gwreiddio'n ddwfn mewn rhagfarnau cymdeithasol, ac yn cael eu hadlewyrchu yn y canlyniadau anghyfartal ymhlith gwahanol grwpiau demograffig. Gallant ystumio penderfyniadau modelau rhagfynegol ac arwain at driniaeth annheg.

Yn y cynllun mawreddog o bethau, gall rhagfarn mewn AI weithredu fel dylanwadwr tawel, gan siapio ein cymdeithas a'n bywydau yn gynnil, yn aml mewn ffyrdd nad ydym hyd yn oed yn sylweddoli. Gallai'r holl bwyntiau uchod eich arwain i gwestiynu pam na chymerwyd camau i'w hatal, ac a yw hyd yn oed yn bosibl.

Yn wir, gyda datblygiadau technolegol newydd mae'n dod yn fwyfwy hygyrch i fynd i'r afael â phroblem o'r fath. Fodd bynnag, y cam cyntaf i fynd i'r afael â'r broblem hon yw deall a chydnabod ei bodolaeth a'i heffaith. Am y tro, mae’r gydnabyddiaeth o’i fodolaeth wedi’i chreu, gan adael y mater o “ddealltwriaeth” yn dal i fod yn eithaf amwys.

Deall Tuedd

Er bod y diffiniad gwreiddiol o duedd fel y'i cyflwynir gan y Geiriadur Caergrawnt nad yw'n crwydro'n rhy bell oddi wrth brif bwrpas y gair fel y mae'n ymwneud ag AI, mae llawer o ddehongliadau gwahanol i'w gwneud o hyd yn oed y diffiniad unigol hwn. Tacsonomegau, fel y rhai a gyflwynir gan ymchwilwyr megis Hellström et al (2020) ac Kliegr (2021), darparu mewnwelediad dyfnach i'r diffiniad o ragfarn. Bydd cipolwg syml ar y papurau hyn yn datgelu, fodd bynnag, bod angen culhau'r diffiniad o'r term yn sylweddol i fynd i'r afael â'r broblem yn effeithiol.

Er ei fod yn newid digwyddiadau, er mwyn diffinio a chyfleu ystyr rhagfarn yn y ffordd orau bosibl, gellir diffinio'r gwrthwyneb yn well, hynny yw Tegwch.

Diffinio Tegwch 

Fel y'i diffinnir mewn amrywiol lenyddiaeth ddiweddar megis Mae Castelnovo et al. (2022), gellir ymhelaethu ar degwch o gael dealltwriaeth o'r term gofod potensial. Fel y mae'n bodoli, mae gofod potensial (PS) yn cyfeirio at faint o alluoedd a gwybodaeth sydd gan unigolyn ni waeth a yw'n perthyn i grŵp demograffig penodol. O ystyried y diffiniad hwn o'r cysyniad o PS, gellir yn hawdd ddiffinio tegwch i fod yn driniaeth gyfartal rhwng dau unigolyn o PS cyfartal, waeth beth fo'u gwahaniaethau gweladwy a chudd mewn paramedrau sy'n achosi tuedd (fel hil, oedran, neu ryw). Mae unrhyw wyriad oddi wrth y diffiniad hwn, a elwir hefyd yn Gyfle Cyfartal, yn arwydd clir o duedd ac yn haeddu ymchwiliad pellach.

Efallai y bydd yr ymarferwyr ymhlith y darllenwyr yn sylwi y gallai cyflawni rhywbeth fel y'i diffinnir yma fod yn gwbl amhosibl o ystyried y rhagfarnau cynhenid sy'n bodoli yn ein byd. Mae hynny'n wir! Mae'r byd yr ydym yn byw ynddo, ynghyd â'r holl ddata a gesglir o ddigwyddiadau yn y byd hwn, yn destun llawer o duedd hanesyddol ac ystadegol. Mae hyn, yn wir, yn lleihau'r hyder o un diwrnod i liniaru'n llawn effeithiau rhagfarn ar fodelau rhagfynegol sydd wedi'u hyfforddi ar ddata “rhagfarnllyd” o'r fath. Fodd bynnag, trwy ddefnyddio amrywiol ddulliau, gellir ceisio lleihau effeithiau rhagfarn. Gan fod hyn yn wir, bydd y derminoleg a ddefnyddir yng ngweddill y post(iau) blog hwn yn symud tuag at y syniad o leihau effaith rhagfarn yn hytrach na'i liniaru'n llawn.

Iawn! Felly nawr bod syniad wedi'i gyflwyno o beth yw tuedd a sut y gallai rhywun werthuso ei fodolaeth; Os ydym am fynd i’r afael â’r broblem yn iawn, fodd bynnag, mae angen inni wybod o ble y mae’r holl ragfarnau hyn yn tarddu.

Deall y Ffynonellau a'r mathau

Mae ymchwil presennol yn rhoi mewnwelediad gwerthfawr i'r gwahanol fathau o ragfarnau mewn dysgu peirianyddol. Fel Mehrabi et. al. (2019) wedi mynd ymlaen i rannu rhagfarnau mewn dysgu peiriant, gall un rannu rhagfarnau yn 3 chategori mawr. sef y rhai o:

Data i Algorithm: categori sy'n cwmpasu rhagfarnau sy'n tarddu o'r data ei hun. Gallai hynny gael ei achosi trwy gasglu data gwael, rhagfarnau cynhenid sy'n bodoli yn y byd, ac ati.
Algorithm i Ddefnyddiwr: categori sy'n canolbwyntio ar ragfarnau sy'n deillio o ddyluniad a gweithrediad yr algorithmau. Mae'n cynnwys sut y gallai algorithmau ddehongli, pwyso a mesur, neu ystyried rhai pwyntiau data dros eraill, a all arwain at ganlyniadau rhagfarnllyd.
Defnyddiwr i Ddata: yn ymwneud â thueddiadau sy'n deillio o ryngweithio defnyddwyr â'r system. Gall y modd y mae defnyddwyr yn mewnbynnu data, eu rhagfarnau cynhenid, neu hyd yn oed eu hymddiriedaeth mewn allbynnau system ddylanwadu ar ganlyniadau.

Ffigur 1: Delweddu'r fframwaith CISP-DM ar gyfer cloddio data; a ddefnyddir yn gyffredin mewn cloddio data ac sy'n berthnasol i'r broses o nodi'r camau y gall rhagfarn ddod i fodolaeth.

Er bod yr enwau'n arwydd o'r ffurf o ragfarn, efallai y bydd gennych gwestiynau o hyd ynghylch y mathau o ragfarnau y gellid eu categoreiddio o dan y termau ymbarél hyn. Ar gyfer y selogion ymhlith ein darllenwyr, rydym wedi darparu dolenni i rai llenyddiaeth sy'n ymwneud â'r derminoleg a'r dosbarthiad hwn. Er mwyn symlrwydd yn y blogbost hwn, byddwn yn ymdrin ag ychydig o ragfarnau dethol sy'n berthnasol i'r sefyllfa (y mae bron pob un ohonynt o'r data categori i algorithm). Mae'r mathau penodol o ragfarnau fel a ganlyn:

Tuedd Hanesyddol: Math o ragfarn sy'n gynhenid i'r data a achosir gan y rhagfarnau naturiol sy'n bodoli yn y byd mewn gwahanol grwpiau cymdeithasol a chymdeithas yn gyffredinol. Oherwydd natur gynhenid y data hwn yn y byd na ellir ei liniaru trwy amrywiol ddulliau samplu a dewis nodweddion.
Tuedd Mesur a Gogwydd Cynrychiolaeth: Mae’r ddwy ragfarn hon sydd â chysylltiad agos yn digwydd pan fo is-grwpiau gwahanol y set ddata yn cynnwys symiau anghyfartal o ganlyniadau “ffafriol”. Gall y math hwn o ragfarn felly ystumio canlyniad modelau rhagfynegol
Tuedd Algorithmig: Tuedd sy'n ymwneud yn unig â'r algorithm a ddefnyddir. Fel y gwelwyd hefyd mewn profion a gynhaliwyd (y manylir arnynt ymhellach yn y post), gall y math hwn o ragfarn gael effaith aruthrol ar degwch algorithm penodol.

Bydd y ddealltwriaeth sylfaenol hyn o ragfarn mewn dysgu peirianyddol yn cael ei defnyddio er mwyn mynd i'r afael â'r broblem yn fwy effeithiol mewn swyddi diweddarach.

Thoughts Terfynol

Yn yr archwiliad hwn o ragfarn o fewn deallusrwydd artiffisial, rydym wedi tynnu sylw at y goblygiadau dwys sydd ganddo yn ein byd sy'n cael ei yrru fwyfwy gan AI. O enghreifftiau yn y byd go iawn fel sgandal lles plant yr Iseldiroedd i arlliwiau cywrain categorïau a mathau o ragfarn, mae'n amlwg bod cydnabod a deall rhagfarn yn hollbwysig.

Er bod yr heriau a achosir gan dueddiadau - boed yn hanesyddol, yn algorithmig neu wedi'u hysgogi gan ddefnyddwyr - yn sylweddol, nid ydynt yn anorchfygol. Gydag amgyffrediad cadarn o wreiddiau ac amlygiadau o ragfarn, rydym mewn gwell sefyllfa i fynd i'r afael â nhw. Fodd bynnag, dim ond y mannau cychwyn yw cydnabyddiaeth a dealltwriaeth.

Wrth inni symud ymlaen yn y gyfres hon, byddwn yn canolbwyntio nesaf ar yr offer a’r fframweithiau diriaethol sydd ar gael inni. Sut ydyn ni'n mesur maint y rhagfarn mewn modelau AI? Ac yn bwysicach fyth, sut mae lleihau ei effaith? Dyma’r cwestiynau dybryd y byddwn yn ymchwilio iddynt nesaf, gan sicrhau wrth i AI barhau i esblygu, ei fod yn gwneud hynny mewn cyfeiriad sy’n deg ac yn berfformol.

Mae data yn synthetig, ond mae ein tîm yn go iawn!

Cysylltwch â Syntho a bydd un o'n harbenigwyr yn cysylltu â chi ar gyflymder y golau i archwilio gwerth data synthetig!

Beth yw data synthetig?

Adroddiad sicrwydd ansawdd

Gwerthusiad allanol gan SAS

Data synthetig cyfres amser

Sganiwr PII

Data Ffug Synthetig

Mapio cyson

Dad-adnabod a syntheteiddio

Data Synthetig yn seiliedig ar Reol

Is-osod

Defnyddio ac integreiddio

Connectors

Nodweddion estynedig

Data a gefnogir

Dogfennaeth defnyddiwr

Trefnwch demo

Prisiau

Data prawf

Dadansoddeg

Rhannu data

Demo's cynnyrch

monetization data

Gofal Iechyd

Cyllid

Sefydliadau Cyhoeddus

Dogfennaeth defnyddiwr

Papurau Gwyn a Chanllawiau

Blog

Gwe-seminarau

Astudiaethau Achos

Prisiau

Amdanom ni

Swyddi

Culprit Anweledig AI: Datrys y Tuedd O Fewn

Cyfres blog bias: rhan 1

Cyflwyniad

Tuedd ar Waith: Enghraifft o Fyd Go Iawn

Deall Tuedd

Diffinio Tegwch

Deall y Ffynonellau a'r mathau

Thoughts Terfynol

Mae data yn synthetig, ond mae ein tîm yn go iawn!

prif ddewislen

Diffinio Tegwch