ผู้ร้ายที่มองไม่เห็นของ AI: เปิดเผยอคติภายใน

ซีรีส์บล็อกอคติ: ตอนที่ 1

บทนำ

ในโลกของเราที่มีรูปแบบปัญญาประดิษฐ์เพิ่มมากขึ้น เครื่องจักรที่ได้รับมอบหมายให้ทำการตัดสินใจที่ซับซ้อนกำลังแพร่หลายมากขึ้นเรื่อยๆ มีวรรณกรรมจำนวนมากขึ้นเรื่อยๆ ที่ระบุถึงการใช้ AI ในขอบเขตต่างๆ เช่น ธุรกิจ การตัดสินใจที่มีเดิมพันสูง และในช่วงไม่กี่ปีที่ผ่านมาในภาคการแพทย์ ด้วยความชุกที่เพิ่มมากขึ้นนี้ ผู้คนได้สังเกตเห็นเกี่ยวกับแนวโน้มในระบบดังกล่าว นั่นคือแม้ว่าจะได้รับการออกแบบโดยธรรมชาติให้ปฏิบัติตามรูปแบบในข้อมูลเพียงอย่างเดียว แต่ก็ได้แสดงสัญญาณของอคติในแง่ที่ว่าสามารถสังเกตพฤติกรรมการกีดกันทางเพศและการเลือกปฏิบัติต่างๆ ได้ ล่าสุด พ.ร.บ. AI ของยุโรปยังครอบคลุมเรื่องของอคติดังกล่าวค่อนข้างกว้างขวางและเป็นรากฐานสำหรับการแก้ไขปัญหาที่เกี่ยวข้อง 

ตลอดหลายปีที่ผ่านมาของเอกสารทางเทคนิค ผู้คนมักจะใช้คำว่า "อคติ" เพื่ออธิบายพฤติกรรมที่บิดเบือนนี้ต่อประชากรบางกลุ่ม คำที่ความหมายแตกต่างกันไป ทำให้เกิดความสับสนและทำให้งานในการจัดการกับคำนั้นยุ่งยากขึ้น

บทความนี้เป็นบทความแรกในชุดโพสต์บล็อกที่ครอบคลุมหัวข้อเรื่องอคติ ในซีรีส์นี้ เราจะตั้งเป้าหมายเพื่อให้คุณมีความเข้าใจที่ชัดเจนและเข้าใจง่ายเกี่ยวกับอคติใน AI เราจะแนะนำวิธีการวัดและลดอคติ และสำรวจบทบาทของข้อมูลสังเคราะห์ในเส้นทางนี้สู่ระบบที่ยุติธรรมมากขึ้น นอกจากนี้เรายังจะให้คุณดูว่า Syntho ซึ่งเป็นผู้เล่นชั้นนำในการสร้างข้อมูลสังเคราะห์สามารถมีส่วนร่วมในความพยายามนี้ได้อย่างไร ดังนั้น ไม่ว่าคุณจะเป็นผู้ปฏิบัติงานที่กำลังมองหาข้อมูลเชิงลึกที่นำไปใช้ได้จริงหรือเพียงอยากรู้เกี่ยวกับหัวข้อนี้ คุณก็มาถูกที่แล้ว

อคติในการดำเนินการ: ตัวอย่างในโลกแห่งความเป็นจริง

คุณอาจสงสัยว่า “อคติใน AI นี้มีความสำคัญ แต่สิ่งนี้มีความหมายสำหรับฉันและสำหรับคนทั่วไปอย่างไร” ความจริงก็คือผลกระทบนั้นกว้างขวาง มักมองไม่เห็นแต่มีพลังมาก อคติใน AI ไม่ได้เป็นเพียงแนวคิดทางวิชาการเท่านั้น มันเป็นปัญหาในโลกแห่งความเป็นจริงและส่งผลร้ายแรงตามมา

ยกตัวอย่างเรื่องอื้อฉาวด้านสวัสดิการเด็กของชาวดัตช์ ระบบอัตโนมัติซึ่งสันนิษฐานว่าเป็นเครื่องมือที่สร้างขึ้นเพื่อสร้างผลลัพธ์ที่ยุติธรรมและมีประสิทธิภาพโดยมีการแทรกแซงของมนุษย์น้อยที่สุดนั้นมีอคติ มันทำเครื่องหมายผู้ปกครองหลายพันรายอย่างไม่ถูกต้องว่ามีการฉ้อโกงโดยอาศัยข้อมูลและสมมติฐานที่มีข้อบกพร่อง ผลลัพธ์? ครอบครัวตกอยู่ในความสับสนวุ่นวาย ชื่อเสียงส่วนบุคคลเสียหาย และความยากลำบากทางการเงิน ทั้งหมดนี้เกิดจากอคติในระบบ AI นี่เป็นตัวอย่างที่เน้นถึงความเร่งด่วนในการจัดการกับอคติใน AI

ผู้คนประท้วง

แหล่งที่มา: "ชดเชยให้กับ toeslagenaffaire kan zomaar tot 2030 duren”, 2023. สหรัฐอเมริกา

แต่อย่าหยุดเพียงแค่นั้น เหตุการณ์นี้ไม่ใช่กรณีเดียวของอคติที่สร้างความหายนะ ผลกระทบของอคติใน AI ขยายไปถึงทุกมุมชีวิตของเรา ตั้งแต่ผู้ที่ได้รับการว่าจ้างงาน ผู้ที่ได้รับอนุมัติสินเชื่อ ไปจนถึงผู้ได้รับการรักษาทางการแพทย์ประเภทใด ระบบ AI ที่มีอคติสามารถขยายเวลาความไม่เท่าเทียมที่มีอยู่และสร้างสิ่งใหม่ได้

ลองพิจารณาสิ่งนี้: ระบบ AI ที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลในอดีตที่มีอคติสามารถปฏิเสธผู้สมัครที่มีคุณสมบัติเหมาะสมได้งานเพียงเพราะเพศหรือเชื้อชาติของพวกเขา หรือระบบ AI ที่มีอคติอาจปฏิเสธการให้กู้ยืมแก่ผู้สมัครที่สมควรได้รับเนื่องจากรหัสไปรษณีย์ สิ่งเหล่านี้ไม่ได้เป็นเพียงสถานการณ์สมมติเท่านั้น พวกเขากำลังเกิดขึ้นตอนนี้

อคติประเภทเฉพาะ เช่น อคติในอดีต และอคติในการวัดผล นำไปสู่การตัดสินใจที่มีข้อบกพร่องดังกล่าว ข้อมูลเหล่านี้มีอยู่ในข้อมูล หยั่งรากลึกในอคติทางสังคม และสะท้อนให้เห็นในผลลัพธ์ที่ไม่เท่าเทียมกันในกลุ่มประชากรที่แตกต่างกัน พวกเขาสามารถบิดเบือนการตัดสินใจของแบบจำลองการคาดการณ์และส่งผลให้เกิดการปฏิบัติที่ไม่เป็นธรรม

ในรูปแบบที่ยิ่งใหญ่ อคติใน AI สามารถทำหน้าที่เป็นผู้มีอิทธิพลเงียบ ๆ กำหนดรูปแบบสังคมและชีวิตของเราอย่างละเอียด บ่อยครั้งในแบบที่เราไม่รู้ด้วยซ้ำ ประเด็นที่กล่าวมาข้างต้นทั้งหมดนี้อาจทำให้คุณสงสัยว่าเหตุใดจึงไม่ดำเนินการใดๆ เพื่อหยุด และเป็นไปได้หรือไม่

แท้จริงแล้วด้วยความก้าวหน้าทางเทคโนโลยีใหม่ ๆ ทำให้สามารถเข้าถึงการแก้ไขปัญหาดังกล่าวได้มากขึ้น อย่างไรก็ตาม ขั้นตอนแรกในการแก้ไขปัญหานี้คือการทำความเข้าใจและรับทราบการมีอยู่และผลกระทบของปัญหาดังกล่าว ขณะนี้การรับรู้ถึงการมีอยู่ของมันได้ถูกสร้างขึ้นแล้ว เหลือเพียงเรื่อง "ความเข้าใจ" ที่ยังค่อนข้างคลุมเครือ 

ทำความเข้าใจกับอคติ

ในขณะที่คำจำกัดความดั้งเดิมของอคติดังที่นำเสนอโดย พจนานุกรมเคมบริดจ์ ไม่หลงไปจากจุดประสงค์หลักของคำมากเกินไปเนื่องจากเกี่ยวข้องกับ AI แม้แต่คำจำกัดความเอกพจน์นี้ก็ยังต้องมีการตีความที่แตกต่างกันมากมาย Taxonomies เช่นที่นำเสนอโดยนักวิจัยเช่น เฮลล์สตรอม และคณะ (2020) และ ไคลเกอร์ (2021)ให้ข้อมูลเชิงลึกที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับคำจำกัดความของอคติ อย่างไรก็ตาม การดูเอกสารเหล่านี้อย่างรวดเร็วจะเผยให้เห็นว่าจำเป็นต้องจำกัดคำจำกัดความของคำให้แคบลงอย่างมากเพื่อแก้ไขปัญหาได้อย่างมีประสิทธิภาพ 

ในขณะที่เป็นการเปลี่ยนแปลงของเหตุการณ์ เพื่อให้สามารถกำหนดและถ่ายทอดความหมายของอคติได้อย่างเหมาะสมที่สุด เราสามารถนิยามสิ่งที่ตรงกันข้ามได้ดีขึ้น นั่นคือ ความเป็นธรรม 

การกำหนดความเป็นธรรม 

ตามที่กำหนดไว้ในวรรณกรรมล่าสุดต่างๆ เช่น คาสเตลโนโว และคณะ (2022)ความยุติธรรมสามารถอธิบายอย่างละเอียดได้เมื่อได้รับความเข้าใจในคำว่า พื้นที่ที่มีศักยภาพ ตามที่มีอยู่ พื้นที่ที่มีศักยภาพ (PS) หมายถึงขอบเขตของความสามารถและความรู้ของแต่ละบุคคล โดยไม่คำนึงถึงว่าพวกเขาอยู่ในกลุ่มประชากรบางกลุ่ม เมื่อพิจารณาจากคำจำกัดความของแนวคิด PS นี้ เราสามารถนิยามความเป็นธรรมได้อย่างง่ายดายว่าเป็นความเท่าเทียมกันของการปฏิบัติระหว่างบุคคลสองคนที่มี PS เท่ากัน โดยไม่คำนึงถึงความแตกต่างที่สังเกตได้และซ่อนเร้นในพารามิเตอร์ที่กระตุ้นให้เกิดอคติ (เช่น เชื้อชาติ อายุ หรือเพศ) การเบี่ยงเบนไปจากคำจำกัดความนี้ หรือที่เรียกว่าความเท่าเทียมกันของโอกาส ถือเป็นข้อบ่งชี้ที่ชัดเจนถึงอคติและข้อดีที่ต้องมีการสอบสวนเพิ่มเติม  

ผู้ปฏิบัติงานในหมู่ผู้อ่านอาจสังเกตเห็นว่าการบรรลุบางสิ่งบางอย่างตามที่กำหนดไว้นี้อาจเป็นไปไม่ได้เลยเนื่องจากอคติที่มีอยู่ในโลกของเรา ถูกแล้ว! โลกที่เราอาศัยอยู่ ตลอดจนข้อมูลทั้งหมดที่รวบรวมจากเหตุการณ์ต่างๆ ในโลกนี้ อยู่ภายใต้อคติทางประวัติศาสตร์และสถิติอย่างมาก สิ่งนี้จะลดความเชื่อมั่นในวันหนึ่งที่จะบรรเทาผลกระทบของอคติต่อแบบจำลองการคาดการณ์ที่ได้รับการฝึกกับข้อมูลที่ "เอนเอียง" ดังกล่าวได้อย่างเต็มที่ อย่างไรก็ตาม โดยการใช้วิธีการต่างๆ เราสามารถพยายามลดผลกระทบของอคติให้เหลือน้อยที่สุดได้ ในกรณีนี้ คำศัพท์ที่ใช้ในส่วนที่เหลือของโพสต์บนบล็อกนี้จะเปลี่ยนไปใช้แนวคิดในการลดผลกระทบจากอคติ แทนที่จะบรรเทาลงทั้งหมด

ตกลง! ตอนนี้ความคิดได้ถูกนำออกมาว่าอคติคืออะไร และเราจะประเมินการดำรงอยู่ของมันได้อย่างไร หากเราต้องการแก้ไขปัญหาอย่างถูกต้อง เราจำเป็นต้องรู้ว่าอคติเหล่านี้มาจากไหน

การทำความเข้าใจแหล่งที่มาและประเภท

การวิจัยที่มีอยู่ให้ข้อมูลเชิงลึกที่มีคุณค่าเกี่ยวกับอคติประเภทต่างๆ ในแมชชีนเลิร์นนิง เช่น เมห์ราบี เอต. อัล (2019) ได้ดำเนินการแบ่งอคติใน Machine Learning ไปแล้ว เราสามารถแบ่งอคติได้เป็น 3 ประเภทใหญ่ๆ ได้แก่:

  • Data to Algorithm: การจัดหมวดหมู่ที่รวบรวมอคติที่มีต้นกำเนิดมาจากตัวข้อมูลเอง อาจเกิดจากการรวบรวมข้อมูลที่ไม่ดี มีอคติโดยธรรมชาติที่มีอยู่ในโลก ฯลฯ
  • อัลกอริทึมต่อผู้ใช้: หมวดหมู่ที่เน้นไปที่อคติที่เกิดจากการออกแบบและการทำงานของอัลกอริทึม รวมถึงวิธีที่อัลกอริธึมอาจตีความ ชั่งน้ำหนัก หรือพิจารณาจุดข้อมูลบางอย่างเหนือจุดอื่นๆ ซึ่งอาจนำไปสู่ผลลัพธ์ที่มีอคติ
  • ผู้ใช้ต่อข้อมูล: เกี่ยวข้องกับอคติที่เกิดขึ้นจากการโต้ตอบของผู้ใช้กับระบบ ลักษณะที่ผู้ใช้ป้อนข้อมูล ความลำเอียงโดยธรรมชาติ หรือแม้แต่ความไว้วางใจในผลลัพธ์ของระบบสามารถมีอิทธิพลต่อผลลัพธ์ได้
กราฟ

รูปที่ 1: การแสดงกรอบงาน CRISP-DM สำหรับการขุดข้อมูล ที่ใช้กันทั่วไปในการทำเหมืองข้อมูลและเกี่ยวข้องกับกระบวนการระบุขั้นตอนที่อคติสามารถเกิดขึ้นได้

แม้ว่าชื่อจะบ่งบอกถึงรูปแบบของอคติ แต่ก็ยังมีคำถามเกี่ยวกับประเภทของอคติที่อาจจัดหมวดหมู่ภายใต้เงื่อนไขทั่วไปเหล่านี้ สำหรับผู้ที่ชื่นชอบในหมู่ผู้อ่านของเรา เราได้จัดเตรียมลิงก์ไปยังวรรณกรรมบางส่วนที่เกี่ยวข้องกับคำศัพท์และการจำแนกประเภทนี้ เพื่อความเรียบง่ายในโพสต์บนบล็อกนี้ เราจะกล่าวถึงอคติที่เลือกบางส่วนที่เกี่ยวข้องกับสถานการณ์ (ซึ่งเกือบทั้งหมดเป็นข้อมูลหมวดหมู่ของอัลกอริทึม) อคติประเภทเฉพาะมีดังนี้:

  • อคติทางประวัติศาสตร์: อคติประเภทหนึ่งที่มีอยู่ในข้อมูลที่เกิดจากอคติทางธรรมชาติที่มีอยู่ในโลกในกลุ่มสังคมต่างๆ และสังคมโดยทั่วไป เป็นเพราะการมีอยู่ของข้อมูลนี้ในโลกจึงไม่สามารถบรรเทาลงได้ด้วยการสุ่มตัวอย่างและการเลือกคุณสมบัติต่างๆ
  • อคติในการวัดผลและอคติในการเป็นตัวแทน: อคติทั้งสองที่เกี่ยวข้องกันอย่างใกล้ชิดเกิดขึ้นเมื่อกลุ่มย่อยที่แตกต่างกันของชุดข้อมูลมีจำนวนผลลัพธ์ "ที่น่าพอใจ" ไม่เท่ากัน อคติประเภทนี้จึงสามารถบิดเบือนผลลัพธ์ของแบบจำลองการทำนายได้
  • Algorithmic Bias: อคติเกี่ยวข้องกับอัลกอริธึมที่ใช้งานอยู่เท่านั้น ดังที่สังเกตได้ในการทดสอบ (อธิบายเพิ่มเติมในโพสต์) อคติประเภทนี้อาจส่งผลกระทบอย่างมากต่อความเป็นธรรมของอัลกอริทึมที่กำหนด

ความเข้าใจพื้นฐานเกี่ยวกับอคติในการเรียนรู้ของเครื่องจะถูกนำมาใช้เพื่อจัดการกับปัญหาได้อย่างมีประสิทธิภาพมากขึ้นในโพสต์ต่อๆ ไป

ข้อคิด

ในการสำรวจอคติภายในปัญญาประดิษฐ์นี้ เราได้ให้ความกระจ่างถึงผลกระทบอันลึกซึ้งที่มีต่อโลกที่ขับเคลื่อนด้วย AI ของเรามากขึ้นเรื่อยๆ จากตัวอย่างในโลกแห่งความเป็นจริง เช่น เรื่องอื้อฉาวด้านสวัสดิภาพเด็กของชาวดัตช์ ไปจนถึงความแตกต่างที่ซับซ้อนของประเภทและประเภทของอคติ เห็นได้ชัดว่าการรับรู้และทำความเข้าใจอคติเป็นสิ่งสำคัญยิ่ง

แม้ว่าความท้าทายที่เกิดจากอคติ ไม่ว่าจะเป็นในอดีต อัลกอริธึม หรือเกิดจากผู้ใช้ ล้วนมีความสำคัญ แต่ก็ไม่สามารถผ่านพ้นไปได้ ด้วยความเข้าใจอย่างแน่นหนาเกี่ยวกับต้นกำเนิดและการสำแดงของอคติ เราก็พร้อมที่จะจัดการกับมันได้ดีขึ้น อย่างไรก็ตาม การรับรู้และความเข้าใจเป็นเพียงจุดเริ่มต้นเท่านั้น

ขณะที่เราก้าวไปข้างหน้าในซีรีส์นี้ จุดสนใจต่อไปของเราคือเครื่องมือและกรอบงานที่จับต้องได้ที่เราจัดการ เราจะวัดขอบเขตของอคติในโมเดล AI ได้อย่างไร และที่สำคัญกว่านั้น เราจะลดผลกระทบให้เหลือน้อยที่สุดได้อย่างไร? เหล่านี้เป็นคำถามเร่งด่วนที่เราจะเจาะลึกต่อไป เพื่อให้แน่ใจว่าในขณะที่ AI ยังคงพัฒนาต่อไป มันก็จะไปในทิศทางที่ยุติธรรมและมีประสิทธิภาพ

กลุ่มคนที่ยิ้ม

ข้อมูลเป็นสิ่งสังเคราะห์ แต่ทีมของเรามีจริง!

ติดต่อ Syntho และหนึ่งในผู้เชี่ยวชาญของเราจะติดต่อคุณด้วยความเร็วแสงเพื่อสำรวจคุณค่าของข้อมูลสังเคราะห์!