Yapay Zekanın Görünmeyen Suçlusu: İçimizdeki Önyargıyı Ortaya Çıkarmak

Bias blog serisi: bölüm 1

Giriş

Zekanın giderek yapaylaştığı dünyamızda, karmaşık kararlar vermekle görevli makineler giderek daha yaygın hale geliyor. Yapay zekanın iş dünyası, yüksek riskli karar alma gibi çeşitli alanlarda ve son birkaç yılda tıp sektöründe kullanıldığını gösteren giderek artan bir literatür var. Ancak bu yaygınlığın artmasıyla birlikte insanlar söz konusu sistemlerdeki endişe verici eğilimleri fark ettiler; Yani, doğası gereği yalnızca verilerdeki kalıpları takip etmek üzere tasarlanmış olsalar da, çeşitli cinsiyetçi ve ayrımcı davranışların gözlemlenebilmesi anlamında önyargı işaretleri göstermişlerdir. Son zamanlarda Avrupa AI Yasasıbu önyargı konusunu da oldukça geniş bir şekilde ele almakta ve bununla bağlantılı sorunların çözümüne yönelik bir temel oluşturmaktadır.

Yıllar süren teknik dokümantasyon boyunca insanlar, belirli demografik özelliklere yönelik bu çarpık davranış türünü tanımlamak için "önyargı" terimini kullanma eğilimindeydi; Anlamı değişen, kafa karışıklığına neden olan ve onu ele alma görevini zorlaştıran bir kelime.

Bu makale önyargı konusunu ele alan bir dizi blog yazısının ilkidir. Bu seride size yapay zekadaki önyargıya ilişkin açık ve anlaşılır bir anlayış sunmayı hedefleyeceğiz. Önyargıyı ölçmenin ve en aza indirmenin yollarını tanıtacağız ve daha adil sistemlere giden bu yolda sentetik verilerin rolünü keşfedeceğiz. Ayrıca sentetik veri üretiminde lider bir oyuncu olan Syntho'nun bu çabaya nasıl katkıda bulunabileceğine de bir göz atacağız. Dolayısıyla, ister eyleme dönüştürülebilir bilgiler arayan bir uygulayıcı olun, ister yalnızca bu konuyu merak ediyor olun, doğru yerdesiniz.

Önyargı Uygulaması: Gerçek Dünyadan Bir Örnek

Şunu merak ediyor olabilirsiniz: "Yapay zekadaki bu önyargı çok önemli, fakat bu benim için, sıradan insanlar için ne anlama geliyor?" Gerçek şu ki, etki geniş kapsamlıdır, genellikle görünmez ama güçlüdür. Yapay zekadaki önyargı yalnızca akademik bir kavram değildir; ciddi sonuçları olan gerçek dünyadaki bir sorundur.

Örnek olarak Hollanda'daki çocuk refahı skandalını ele alalım. Minimum insan müdahalesiyle adil ve etkili sonuçlar elde etmek için yaratıldığı varsayılan bir araç olan otomatik sistem önyargılıydı. Hatalı verilere ve varsayımlara dayanarak binlerce ebeveyni sahtekarlık nedeniyle yanlış bir şekilde işaretledi. Sonuç? Aileler kargaşaya sürükleniyor, kişisel itibarları zarar görüyor ve mali zorluklar yaşanıyor; bunların hepsi Yapay Zeka Sistemindeki önyargılar yüzünden. Yapay zekadaki önyargıyı ele almanın aciliyetini vurgulayan bunlar gibi örneklerdir.

Kaynak: "Tazminat ödemeleri 2030 yılına kadar devam edecek”, 2023. BİZİM

Ama burada durmayalım. Bu olay, hasara yol açan münferit bir önyargı vakası değil. Yapay zekadaki önyargının etkisi hayatımızın her köşesine uzanıyor. Kimin bir iş için işe alındığı, kimin kredi onayı aldığı, kimin ne tür tıbbi tedavi göreceği gibi konularda önyargılı yapay zeka sistemleri mevcut eşitsizlikleri sürdürebilir ve yenilerini yaratabilir.

Şunu düşünün: Önyargılı tarihsel verilerle eğitilmiş bir yapay zeka sistemi, yalnızca cinsiyeti veya etnik kökeni nedeniyle iyi nitelikli bir adayın işini reddedebilir. Veya önyargılı bir yapay zeka sistemi, posta kodu nedeniyle hak eden bir adayın kredisini reddedebilir. Bunlar yalnızca varsayımsal senaryolar değil; bunlar şu anda oluyor.

Tarihsel Önyargı ve Ölçüm Önyargısı gibi belirli önyargı türleri bu tür hatalı kararlara yol açar. Bunlar verilerin doğasında vardır, toplumsal önyargıların derinlerine kök salmıştır ve farklı demografik gruplar arasındaki eşitsiz sonuçlara da yansır. Tahmine dayalı modellerin kararlarını çarpıtabilir ve adil olmayan muameleye yol açabilirler.

Büyük şemaya göre, yapay zekadaki önyargı, sessiz bir etki unsuru olarak hareket edebilir, toplumumuzu ve hayatlarımızı çoğu zaman farkına bile varmadığımız şekillerde ustaca şekillendirebilir. Tüm bu sayılanlar, sizi durdurmaya yönelik neden önlem alınmadığını, hatta bunun mümkün olup olmadığını sorgulamanıza yol açabilir.

Gerçekten de, yeni teknolojik gelişmelerle birlikte bu tür sorunların üstesinden gelmek giderek daha erişilebilir hale geliyor. Ancak bu sorunu çözmenin ilk adımı, onun varlığını ve etkisini anlamak ve kabul etmektir. Şimdilik, varlığının kabulü yaratıldı ve “anlama” konusu hala oldukça belirsiz kaldı.

Önyargıyı Anlamak

Tarafından sunulan orijinal önyargı tanımı olmasına rağmen Cambridge Sözlüğü Yapay Zeka ile ilgili olduğu için kelimenin asıl amacından çok da uzaklaşmasa da, bu tekil tanım bile pek çok farklı yoruma tabi tutulacaktır. Araştırmacılar tarafından sunulanlar gibi taksonomiler Hellström ve diğerleri (2020) ve Kliegr (2021), önyargının tanımına ilişkin daha derin bilgiler sağlar. Ancak bu makalelere basit bir bakış, sorunun etkili bir şekilde çözülebilmesi için terimin tanımının büyük ölçüde daraltılmasının gerekli olduğunu ortaya çıkaracaktır.

Olayların değişmesine rağmen, önyargının anlamını en iyi şekilde tanımlamak ve iletmek için tam tersini, yani Adilliği daha iyi tanımlayabiliriz.

Adilliğin Tanımlanması 

Çeşitli güncel literatürde tanımlandığı gibi Castelnovo ve diğerleri. (2022)Potansiyel alan terimi anlaşıldığında adalet daha da detaylandırılabilir. Mevcut haliyle potansiyel alan (PS), belirli bir demografik gruba ait olup olmadığına bakılmaksızın bir bireyin yeteneklerinin ve bilgisinin kapsamını ifade eder. PS kavramının bu tanımı göz önüne alındığında, adaleti, önyargıya neden olan parametrelerdeki (ırk, yaş veya cinsiyet gibi) gözlemlenebilir ve gizli farklılıklara bakılmaksızın, eşit PS'ye sahip iki kişi arasındaki muamelenin eşitliği olarak kolayca tanımlayabiliriz. Fırsat Eşitliği olarak da adlandırılan bu tanımdan herhangi bir sapma, önyargının açık bir göstergesidir ve daha fazla araştırmayı hak etmektedir.

Okuyucular arasındaki uygulayıcılar, dünyamızda mevcut olan önyargılar göz önüne alındığında, burada tanımlanan bir şeyi başarmanın tamamen imkansız olabileceğini fark edebilirler. Bu doğru! İçinde yaşadığımız dünya, bu dünyadaki olaylardan toplanan tüm verilerle birlikte, pek çok tarihsel ve istatistiksel önyargıya tabidir. Bu, aslında, bir gün bu tür "önyargılı" veriler üzerinde eğitilen tahmine dayalı modeller üzerindeki önyargının etkilerini tamamen hafifleteceğine olan güveni azaltır. Ancak çeşitli yöntemlerin kullanılmasıyla önyargının etkileri en aza indirilmeye çalışılabilir. Durum böyle olunca, bu blog yazılarının geri kalanında kullanılan terminoloji, önyargının etkisini tamamen azaltmak yerine en aza indirme fikrine doğru kayacaktır.

Tamam aşkım! Artık önyargının ne olduğu ve onun varlığını potansiyel olarak nasıl değerlendirebileceğimize dair bir fikir ortaya atıldığına göre; Ancak sorunu doğru bir şekilde çözmek istiyorsak, tüm bu önyargıların nereden kaynaklandığını bilmemiz gerekiyor.

Kaynakları ve türlerini anlama

Mevcut araştırmalar, makine öğrenimindeki farklı önyargı türlerine ilişkin değerli bilgiler sağlıyor. Gibi Mehrabi et. al. (2019) Makine öğrenimindeki önyargıları ayırmaya devam ettiğimizde, önyargıları 3 ana kategoriye ayırabiliriz. Yani şunlardan:

Veriden Algoritmaya: Verinin kendisinden kaynaklanan önyargıları kapsayan bir kategori. Bunun nedeni veri toplamanın zayıf olması, dünyada var olan önyargılar vb. olabilir.
Kullanıcıya Algoritma: algoritmaların tasarımından ve işlevselliğinden kaynaklanan önyargılara odaklanan bir kategori. Algoritmaların belirli veri noktalarını diğerlerine göre nasıl yorumlayabileceğini, değerlendirebileceğini veya değerlendirebileceğini içerir; bu da önyargılı sonuçlara yol açabilir.
Kullanıcıdan Veriye: Kullanıcının sistemle etkileşiminden kaynaklanan önyargılarla ilgilidir. Kullanıcıların veri girme şekli, doğal önyargıları ve hatta sistem çıktılarına olan güvenleri sonuçları etkileyebilir.

Şekil 1: Veri madenciliği için CRISP-DM çerçevesinin görselleştirilmesi; veri madenciliğinde yaygın olarak kullanılır ve önyargının ortaya çıkabileceği aşamaların belirlenmesi süreciyle ilgilidir.

İsimler önyargı biçiminin göstergesi olsa da, bu şemsiye terimler altında kategorize edilebilecek önyargı türlerine ilişkin hâlâ sorular olabilir. Okuyucularımız arasındaki meraklılar için bu terminoloji ve sınıflandırmayla ilgili bazı literatüre bağlantılar sunduk. Bu blog yazısında basitlik adına, durumla alakalı birkaç seçilmiş önyargıyı ele alacağız (bunların neredeyse tamamı algoritmaya yönelik kategori verileridir). Belirli önyargı türleri aşağıdaki gibidir:

Tarihsel Önyargı: Dünyadaki farklı sosyal gruplarda ve genel olarak toplumda var olan doğal önyargıların neden olduğu, verilere özgü bir önyargı türüdür. Bu verilerin dünyadaki doğasından dolayı, çeşitli örnekleme ve özellik seçimi yoluyla hafifletilmesi mümkün değildir.
Ölçüm Önyargısı ve Temsil Önyargısı: Birbiriyle yakından ilişkili bu iki önyargı, veri kümesinin farklı alt grupları eşit olmayan miktarlarda "olumlu" sonuçlar içerdiğinde ortaya çıkar. Bu tür bir önyargı bu nedenle tahmine dayalı modellerin sonucunu çarpıtabilir
Algoritmik Önyargı: Tamamen kullanılan algoritmayla ilgili önyargı. Yapılan testlerde de gözlemlendiği gibi (yazının devamında ayrıntılı olarak ele alınmıştır), bu tür bir önyargı, belirli bir algoritmanın adaleti üzerinde çok büyük bir etkiye sahip olabilir.

Makine öğrenimindeki önyargıya ilişkin bu temel anlayışlar, daha sonraki gönderilerde sorunu daha etkili bir şekilde çözmek için kullanılacaktır.

Son Düşüncelerimiz

Yapay zekadaki önyargının bu keşfinde, yapay zekanın giderek daha fazla yapay zeka tarafından yönlendirilen dünyamızda barındırdığı derin etkileri aydınlattık. Hollanda çocuk refahı skandalı gibi gerçek dünyadaki örneklerden önyargı kategorileri ve türlerinin karmaşık nüanslarına kadar, önyargıyı tanımanın ve anlamanın çok önemli olduğu açıktır.

Önyargıların ortaya çıkardığı zorluklar (tarihsel, algoritmik veya kullanıcı kaynaklı olsun) önemli olsa da aşılamaz değildir. Önyargının kökenleri ve tezahürleri hakkında sağlam bir kavrayışa sahip olduğumuzda, bunları ele alma konusunda daha donanımlı oluruz. Ancak tanıma ve anlama sadece başlangıç noktalarıdır.

Bu seride ilerledikçe bir sonraki odak noktamız elimizdeki somut araçlar ve çerçeveler olacaktır. Yapay zeka modellerindeki önyargının boyutunu nasıl ölçeriz? Daha da önemlisi etkisini nasıl en aza indirebiliriz? Bunlar, yapay zekanın gelişmeye devam ettikçe bunu hem adil hem de performanslı bir yönde yapmasını sağlayacak şekilde bir sonraki aşamada ele alacağımız acil sorulardır.

Veriler sentetiktir ancak ekibimiz gerçektir!

Syntho ile iletişim kurun ve uzmanlarımızdan biri, sentetik verilerin değerini keşfetmek için ışık hızında sizinle iletişime geçecek!

Sentetik veri nedir?

Kalite güvence raporu

SAS tarafından dış değerlendirme

Zaman serisi sentetik verileri

Kimlik Bilgisi Tarayıcısı

Sentetik Sahte Veriler

Tutarlı haritalama

Kimliksizleştirme ve sentezleme

Kural Tabanlı Sentetik Veriler

alt kümeleme

Dağıtım ve entegrasyon

konektörler

Genişletilmiş özellikler

Desteklenen veriler

Kullanıcı belgeleri

Bir demo planlayın

Fiyatlandırma

Test verisi

analitik

Bilgi paylaşımı

Ürün demosu

Veri para kazanma

Sağlık hizmeti

Finans

Kamu Kuruluşları

Kullanıcı belgeleri

Teknik İncelemeler ve Kılavuzlar

Blog

Web Seminerleri

Durum çalışmaları

Fiyatlandırma

Hakkımızda

Kariyer

Yapay Zekanın Görünmeyen Suçlusu: İçimizdeki Önyargıyı Ortaya Çıkarmak

Bias blog serisi: bölüm 1

Giriş

Önyargı Uygulaması: Gerçek Dünyadan Bir Örnek

Önyargıyı Anlamak

Adilliğin Tanımlanması

Kaynakları ve türlerini anlama

Son Düşüncelerimiz

Veriler sentetiktir ancak ekibimiz gerçektir!

Ana menü

Adilliğin Tanımlanması