ผู้ร้ายที่มองไม่เห็นของ AI: เปิดเผยอคติภายใน

ซีรีส์บล็อกอคติ: ตอนที่ 1

บทนำ

ในโลกของเราที่มีรูปแบบปัญญาประดิษฐ์เพิ่มมากขึ้น เครื่องจักรที่ได้รับมอบหมายให้ทำการตัดสินใจที่ซับซ้อนกำลังแพร่หลายมากขึ้นเรื่อยๆ มีวรรณกรรมจำนวนมากขึ้นเรื่อยๆ ที่ระบุถึงการใช้ AI ในขอบเขตต่างๆ เช่น ธุรกิจ การตัดสินใจที่มีเดิมพันสูง และในช่วงไม่กี่ปีที่ผ่านมาในภาคการแพทย์ ด้วยความชุกที่เพิ่มมากขึ้นนี้ ผู้คนได้สังเกตเห็นเกี่ยวกับแนวโน้มในระบบดังกล่าว นั่นคือแม้ว่าจะได้รับการออกแบบโดยธรรมชาติให้ปฏิบัติตามรูปแบบในข้อมูลเพียงอย่างเดียว แต่ก็ได้แสดงสัญญาณของอคติในแง่ที่ว่าสามารถสังเกตพฤติกรรมการกีดกันทางเพศและการเลือกปฏิบัติต่างๆ ได้ ล่าสุด พ.ร.บ. AI ของยุโรปยังครอบคลุมเรื่องของอคติดังกล่าวค่อนข้างกว้างขวางและเป็นรากฐานสำหรับการแก้ไขปัญหาที่เกี่ยวข้อง

ตลอดหลายปีที่ผ่านมาของเอกสารทางเทคนิค ผู้คนมักจะใช้คำว่า "อคติ" เพื่ออธิบายพฤติกรรมที่บิดเบือนนี้ต่อประชากรบางกลุ่ม คำที่ความหมายแตกต่างกันไป ทำให้เกิดความสับสนและทำให้งานในการจัดการกับคำนั้นยุ่งยากขึ้น

บทความนี้เป็นบทความแรกในชุดโพสต์บล็อกที่ครอบคลุมหัวข้อเรื่องอคติ ในซีรีส์นี้ เราจะตั้งเป้าหมายเพื่อให้คุณมีความเข้าใจที่ชัดเจนและเข้าใจง่ายเกี่ยวกับอคติใน AI เราจะแนะนำวิธีการวัดและลดอคติ และสำรวจบทบาทของข้อมูลสังเคราะห์ในเส้นทางนี้สู่ระบบที่ยุติธรรมมากขึ้น นอกจากนี้เรายังจะให้คุณดูว่า Syntho ซึ่งเป็นผู้เล่นชั้นนำในการสร้างข้อมูลสังเคราะห์สามารถมีส่วนร่วมในความพยายามนี้ได้อย่างไร ดังนั้น ไม่ว่าคุณจะเป็นผู้ปฏิบัติงานที่กำลังมองหาข้อมูลเชิงลึกที่นำไปใช้ได้จริงหรือเพียงอยากรู้เกี่ยวกับหัวข้อนี้ คุณก็มาถูกที่แล้ว

อคติในการดำเนินการ: ตัวอย่างในโลกแห่งความเป็นจริง

คุณอาจสงสัยว่า “อคติใน AI นี้มีความสำคัญ แต่สิ่งนี้มีความหมายสำหรับฉันและสำหรับคนทั่วไปอย่างไร” ความจริงก็คือผลกระทบนั้นกว้างขวาง มักมองไม่เห็นแต่มีพลังมาก อคติใน AI ไม่ได้เป็นเพียงแนวคิดทางวิชาการเท่านั้น มันเป็นปัญหาในโลกแห่งความเป็นจริงและส่งผลร้ายแรงตามมา

ยกตัวอย่างเรื่องอื้อฉาวด้านสวัสดิการเด็กของชาวดัตช์ ระบบอัตโนมัติซึ่งสันนิษฐานว่าเป็นเครื่องมือที่สร้างขึ้นเพื่อสร้างผลลัพธ์ที่ยุติธรรมและมีประสิทธิภาพโดยมีการแทรกแซงของมนุษย์น้อยที่สุดนั้นมีอคติ มันทำเครื่องหมายผู้ปกครองหลายพันรายอย่างไม่ถูกต้องว่ามีการฉ้อโกงโดยอาศัยข้อมูลและสมมติฐานที่มีข้อบกพร่อง ผลลัพธ์? ครอบครัวตกอยู่ในความสับสนวุ่นวาย ชื่อเสียงส่วนบุคคลเสียหาย และความยากลำบากทางการเงิน ทั้งหมดนี้เกิดจากอคติในระบบ AI นี่เป็นตัวอย่างที่เน้นถึงความเร่งด่วนในการจัดการกับอคติใน AI

แหล่งที่มา: "ชดเชยให้กับ toeslagenaffaire kan zomaar tot 2030 duren”, 2023. สหรัฐอเมริกา

แต่อย่าหยุดเพียงแค่นั้น เหตุการณ์นี้ไม่ใช่กรณีเดียวของอคติที่สร้างความหายนะ ผลกระทบของอคติใน AI ขยายไปถึงทุกมุมชีวิตของเรา ตั้งแต่ผู้ที่ได้รับการว่าจ้างงาน ผู้ที่ได้รับอนุมัติสินเชื่อ ไปจนถึงผู้ได้รับการรักษาทางการแพทย์ประเภทใด ระบบ AI ที่มีอคติสามารถขยายเวลาความไม่เท่าเทียมที่มีอยู่และสร้างสิ่งใหม่ได้

ลองพิจารณาสิ่งนี้: ระบบ AI ที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลในอดีตที่มีอคติสามารถปฏิเสธผู้สมัครที่มีคุณสมบัติเหมาะสมได้งานเพียงเพราะเพศหรือเชื้อชาติของพวกเขา หรือระบบ AI ที่มีอคติอาจปฏิเสธการให้กู้ยืมแก่ผู้สมัครที่สมควรได้รับเนื่องจากรหัสไปรษณีย์ สิ่งเหล่านี้ไม่ได้เป็นเพียงสถานการณ์สมมติเท่านั้น พวกเขากำลังเกิดขึ้นตอนนี้

อคติประเภทเฉพาะ เช่น อคติในอดีต และอคติในการวัดผล นำไปสู่การตัดสินใจที่มีข้อบกพร่องดังกล่าว ข้อมูลเหล่านี้มีอยู่ในข้อมูล หยั่งรากลึกในอคติทางสังคม และสะท้อนให้เห็นในผลลัพธ์ที่ไม่เท่าเทียมกันในกลุ่มประชากรที่แตกต่างกัน พวกเขาสามารถบิดเบือนการตัดสินใจของแบบจำลองการคาดการณ์และส่งผลให้เกิดการปฏิบัติที่ไม่เป็นธรรม

ในรูปแบบที่ยิ่งใหญ่ อคติใน AI สามารถทำหน้าที่เป็นผู้มีอิทธิพลเงียบ ๆ กำหนดรูปแบบสังคมและชีวิตของเราอย่างละเอียด บ่อยครั้งในแบบที่เราไม่รู้ด้วยซ้ำ ประเด็นที่กล่าวมาข้างต้นทั้งหมดนี้อาจทำให้คุณสงสัยว่าเหตุใดจึงไม่ดำเนินการใดๆ เพื่อหยุด และเป็นไปได้หรือไม่

แท้จริงแล้วด้วยความก้าวหน้าทางเทคโนโลยีใหม่ ๆ ทำให้สามารถเข้าถึงการแก้ไขปัญหาดังกล่าวได้มากขึ้น อย่างไรก็ตาม ขั้นตอนแรกในการแก้ไขปัญหานี้คือการทำความเข้าใจและรับทราบการมีอยู่และผลกระทบของปัญหาดังกล่าว ขณะนี้การรับรู้ถึงการมีอยู่ของมันได้ถูกสร้างขึ้นแล้ว เหลือเพียงเรื่อง "ความเข้าใจ" ที่ยังค่อนข้างคลุมเครือ

ทำความเข้าใจกับอคติ

ในขณะที่คำจำกัดความดั้งเดิมของอคติดังที่นำเสนอโดย พจนานุกรมเคมบริดจ์ ไม่หลงไปจากจุดประสงค์หลักของคำมากเกินไปเนื่องจากเกี่ยวข้องกับ AI แม้แต่คำจำกัดความเอกพจน์นี้ก็ยังต้องมีการตีความที่แตกต่างกันมากมาย Taxonomies เช่นที่นำเสนอโดยนักวิจัยเช่น เฮลล์สตรอม และคณะ (2020) และ ไคลเกอร์ (2021)ให้ข้อมูลเชิงลึกที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับคำจำกัดความของอคติ อย่างไรก็ตาม การดูเอกสารเหล่านี้อย่างรวดเร็วจะเผยให้เห็นว่าจำเป็นต้องจำกัดคำจำกัดความของคำให้แคบลงอย่างมากเพื่อแก้ไขปัญหาได้อย่างมีประสิทธิภาพ

ในขณะที่เป็นการเปลี่ยนแปลงของเหตุการณ์ เพื่อให้สามารถกำหนดและถ่ายทอดความหมายของอคติได้อย่างเหมาะสมที่สุด เราสามารถนิยามสิ่งที่ตรงกันข้ามได้ดีขึ้น นั่นคือ ความเป็นธรรม

การกำหนดความเป็นธรรม 

ตามที่กำหนดไว้ในวรรณกรรมล่าสุดต่างๆ เช่น คาสเตลโนโว และคณะ (2022)ความยุติธรรมสามารถอธิบายอย่างละเอียดได้เมื่อได้รับความเข้าใจในคำว่า พื้นที่ที่มีศักยภาพ ตามที่มีอยู่ พื้นที่ที่มีศักยภาพ (PS) หมายถึงขอบเขตของความสามารถและความรู้ของแต่ละบุคคล โดยไม่คำนึงถึงว่าพวกเขาอยู่ในกลุ่มประชากรบางกลุ่ม เมื่อพิจารณาจากคำจำกัดความของแนวคิด PS นี้ เราสามารถนิยามความเป็นธรรมได้อย่างง่ายดายว่าเป็นความเท่าเทียมกันของการปฏิบัติระหว่างบุคคลสองคนที่มี PS เท่ากัน โดยไม่คำนึงถึงความแตกต่างที่สังเกตได้และซ่อนเร้นในพารามิเตอร์ที่กระตุ้นให้เกิดอคติ (เช่น เชื้อชาติ อายุ หรือเพศ) การเบี่ยงเบนไปจากคำจำกัดความนี้ หรือที่เรียกว่าความเท่าเทียมกันของโอกาส ถือเป็นข้อบ่งชี้ที่ชัดเจนถึงอคติและข้อดีที่ต้องมีการสอบสวนเพิ่มเติม

ผู้ปฏิบัติงานในหมู่ผู้อ่านอาจสังเกตเห็นว่าการบรรลุบางสิ่งบางอย่างตามที่กำหนดไว้นี้อาจเป็นไปไม่ได้เลยเนื่องจากอคติที่มีอยู่ในโลกของเรา ถูกแล้ว! โลกที่เราอาศัยอยู่ ตลอดจนข้อมูลทั้งหมดที่รวบรวมจากเหตุการณ์ต่างๆ ในโลกนี้ อยู่ภายใต้อคติทางประวัติศาสตร์และสถิติอย่างมาก สิ่งนี้จะลดความเชื่อมั่นในวันหนึ่งที่จะบรรเทาผลกระทบของอคติต่อแบบจำลองการคาดการณ์ที่ได้รับการฝึกกับข้อมูลที่ "เอนเอียง" ดังกล่าวได้อย่างเต็มที่ อย่างไรก็ตาม โดยการใช้วิธีการต่างๆ เราสามารถพยายามลดผลกระทบของอคติให้เหลือน้อยที่สุดได้ ในกรณีนี้ คำศัพท์ที่ใช้ในส่วนที่เหลือของโพสต์บนบล็อกนี้จะเปลี่ยนไปใช้แนวคิดในการลดผลกระทบจากอคติ แทนที่จะบรรเทาลงทั้งหมด

ตกลง! ตอนนี้ความคิดได้ถูกนำออกมาว่าอคติคืออะไร และเราจะประเมินการดำรงอยู่ของมันได้อย่างไร หากเราต้องการแก้ไขปัญหาอย่างถูกต้อง เราจำเป็นต้องรู้ว่าอคติเหล่านี้มาจากไหน

การทำความเข้าใจแหล่งที่มาและประเภท

การวิจัยที่มีอยู่ให้ข้อมูลเชิงลึกที่มีคุณค่าเกี่ยวกับอคติประเภทต่างๆ ในแมชชีนเลิร์นนิง เช่น เมห์ราบี เอต. อัล (2019) ได้ดำเนินการแบ่งอคติใน Machine Learning ไปแล้ว เราสามารถแบ่งอคติได้เป็น 3 ประเภทใหญ่ๆ ได้แก่:

Data to Algorithm: การจัดหมวดหมู่ที่รวบรวมอคติที่มีต้นกำเนิดมาจากตัวข้อมูลเอง อาจเกิดจากการรวบรวมข้อมูลที่ไม่ดี มีอคติโดยธรรมชาติที่มีอยู่ในโลก ฯลฯ
อัลกอริทึมต่อผู้ใช้: หมวดหมู่ที่เน้นไปที่อคติที่เกิดจากการออกแบบและการทำงานของอัลกอริทึม รวมถึงวิธีที่อัลกอริธึมอาจตีความ ชั่งน้ำหนัก หรือพิจารณาจุดข้อมูลบางอย่างเหนือจุดอื่นๆ ซึ่งอาจนำไปสู่ผลลัพธ์ที่มีอคติ
ผู้ใช้ต่อข้อมูล: เกี่ยวข้องกับอคติที่เกิดขึ้นจากการโต้ตอบของผู้ใช้กับระบบ ลักษณะที่ผู้ใช้ป้อนข้อมูล ความลำเอียงโดยธรรมชาติ หรือแม้แต่ความไว้วางใจในผลลัพธ์ของระบบสามารถมีอิทธิพลต่อผลลัพธ์ได้

รูปที่ 1: การแสดงกรอบงาน CRISP-DM สำหรับการขุดข้อมูล ที่ใช้กันทั่วไปในการทำเหมืองข้อมูลและเกี่ยวข้องกับกระบวนการระบุขั้นตอนที่อคติสามารถเกิดขึ้นได้

แม้ว่าชื่อจะบ่งบอกถึงรูปแบบของอคติ แต่ก็ยังมีคำถามเกี่ยวกับประเภทของอคติที่อาจจัดหมวดหมู่ภายใต้เงื่อนไขทั่วไปเหล่านี้ สำหรับผู้ที่ชื่นชอบในหมู่ผู้อ่านของเรา เราได้จัดเตรียมลิงก์ไปยังวรรณกรรมบางส่วนที่เกี่ยวข้องกับคำศัพท์และการจำแนกประเภทนี้ เพื่อความเรียบง่ายในโพสต์บนบล็อกนี้ เราจะกล่าวถึงอคติที่เลือกบางส่วนที่เกี่ยวข้องกับสถานการณ์ (ซึ่งเกือบทั้งหมดเป็นข้อมูลหมวดหมู่ของอัลกอริทึม) อคติประเภทเฉพาะมีดังนี้:

อคติทางประวัติศาสตร์: อคติประเภทหนึ่งที่มีอยู่ในข้อมูลที่เกิดจากอคติทางธรรมชาติที่มีอยู่ในโลกในกลุ่มสังคมต่างๆ และสังคมโดยทั่วไป เป็นเพราะการมีอยู่ของข้อมูลนี้ในโลกจึงไม่สามารถบรรเทาลงได้ด้วยการสุ่มตัวอย่างและการเลือกคุณสมบัติต่างๆ
อคติในการวัดผลและอคติในการเป็นตัวแทน: อคติทั้งสองที่เกี่ยวข้องกันอย่างใกล้ชิดเกิดขึ้นเมื่อกลุ่มย่อยที่แตกต่างกันของชุดข้อมูลมีจำนวนผลลัพธ์ "ที่น่าพอใจ" ไม่เท่ากัน อคติประเภทนี้จึงสามารถบิดเบือนผลลัพธ์ของแบบจำลองการทำนายได้
Algorithmic Bias: อคติเกี่ยวข้องกับอัลกอริธึมที่ใช้งานอยู่เท่านั้น ดังที่สังเกตได้ในการทดสอบ (อธิบายเพิ่มเติมในโพสต์) อคติประเภทนี้อาจส่งผลกระทบอย่างมากต่อความเป็นธรรมของอัลกอริทึมที่กำหนด

ความเข้าใจพื้นฐานเกี่ยวกับอคติในการเรียนรู้ของเครื่องจะถูกนำมาใช้เพื่อจัดการกับปัญหาได้อย่างมีประสิทธิภาพมากขึ้นในโพสต์ต่อๆ ไป

ข้อคิด

ในการสำรวจอคติภายในปัญญาประดิษฐ์นี้ เราได้ให้ความกระจ่างถึงผลกระทบอันลึกซึ้งที่มีต่อโลกที่ขับเคลื่อนด้วย AI ของเรามากขึ้นเรื่อยๆ จากตัวอย่างในโลกแห่งความเป็นจริง เช่น เรื่องอื้อฉาวด้านสวัสดิภาพเด็กของชาวดัตช์ ไปจนถึงความแตกต่างที่ซับซ้อนของประเภทและประเภทของอคติ เห็นได้ชัดว่าการรับรู้และทำความเข้าใจอคติเป็นสิ่งสำคัญยิ่ง

แม้ว่าความท้าทายที่เกิดจากอคติ ไม่ว่าจะเป็นในอดีต อัลกอริธึม หรือเกิดจากผู้ใช้ ล้วนมีความสำคัญ แต่ก็ไม่สามารถผ่านพ้นไปได้ ด้วยความเข้าใจอย่างแน่นหนาเกี่ยวกับต้นกำเนิดและการสำแดงของอคติ เราก็พร้อมที่จะจัดการกับมันได้ดีขึ้น อย่างไรก็ตาม การรับรู้และความเข้าใจเป็นเพียงจุดเริ่มต้นเท่านั้น

ขณะที่เราก้าวไปข้างหน้าในซีรีส์นี้ จุดสนใจต่อไปของเราคือเครื่องมือและกรอบงานที่จับต้องได้ที่เราจัดการ เราจะวัดขอบเขตของอคติในโมเดล AI ได้อย่างไร และที่สำคัญกว่านั้น เราจะลดผลกระทบให้เหลือน้อยที่สุดได้อย่างไร? เหล่านี้เป็นคำถามเร่งด่วนที่เราจะเจาะลึกต่อไป เพื่อให้แน่ใจว่าในขณะที่ AI ยังคงพัฒนาต่อไป มันก็จะไปในทิศทางที่ยุติธรรมและมีประสิทธิภาพ

ข้อมูลเป็นสิ่งสังเคราะห์ แต่ทีมของเรามีจริง!

ติดต่อ Syntho และหนึ่งในผู้เชี่ยวชาญของเราจะติดต่อคุณด้วยความเร็วแสงเพื่อสำรวจคุณค่าของข้อมูลสังเคราะห์!

ข้อมูลสังเคราะห์คืออะไร?

รายงานการประกันคุณภาพ

การประเมินภายนอกโดย SAS

ข้อมูลสังเคราะห์อนุกรมเวลา

เครื่องสแกน PII

ข้อมูลจำลองสังเคราะห์

การทำแผนที่ที่สอดคล้องกัน

การไม่ระบุตัวตนและการสังเคราะห์

ข้อมูลสังเคราะห์ตามกฎ

เซตย่อย

การปรับใช้และการบูรณาการ

เชื่อมต่อ

คุณสมบัติเพิ่มเติม

ข้อมูลที่รองรับ

เอกสารประกอบสำหรับผู้ใช้

กำหนดเวลาการสาธิต

ราคา

ทดสอบข้อมูล

บทวิเคราะห์

การแชร์ข้อมูล

การสาธิตผลิตภัณฑ์

การสร้างรายได้จากข้อมูล

การดูแลสุขภาพ

การเงิน

องค์การมหาชน

เอกสารประกอบสำหรับผู้ใช้

เอกสารไวท์เปเปอร์และคำแนะนำ

บล็อก

webinars

กรณีศึกษา

ราคา

เกี่ยวกับเรา

ตำแหน่งงาน

ผู้ร้ายที่มองไม่เห็นของ AI: เปิดเผยอคติภายใน

ซีรีส์บล็อกอคติ: ตอนที่ 1

บทนำ

อคติในการดำเนินการ: ตัวอย่างในโลกแห่งความเป็นจริง

ทำความเข้าใจกับอคติ

การกำหนดความเป็นธรรม

การทำความเข้าใจแหล่งที่มาและประเภท

ข้อคิด

ข้อมูลเป็นสิ่งสังเคราะห์ แต่ทีมของเรามีจริง!

เมนูหลัก

การกำหนดความเป็นธรรม