Yapay zekanın ön yargılarını yönetin
Sian Townson
İşletmeler ve hükümetler rahatsız edici bir gerçekle yüzleşmek zorunda: Yapay zeka (YZ) umutsuzca ve doğası gereği ön yargılı. Bu tür ön yargıların nasıl önleneceğini sormak birçok yönden yanlış bir soru çünkü YZ bir dizi örnekten öğrenme ve genelleme yapma aracı ve çoğu zaman örnekler doğrudan tarihsel verilerden alınıyor. Çeşitli gruplara karşı ön yar- gılar tarihe gömülü olduğu için bu önyargılar bir dereceye kadar YZ aracılığıyla sürdürülüyor.
Geleneksel ve görünüşte mantıklı önlemler sorunu çözmüyor. Örneğin bir model tasarımcısı, bir bireyin cinsiyetini veya ırkını gösteren değişkenleri dışarıda bırakabilir, bu özellikleri bilmekten kaynaklanan herhangi bir ön yargının böylece ortadan kaldırılacağını umarak. Ancak modern algoritmalar, bu tür bilgiler için vekiller (proxy) keşfetmede mükemmel. Ne kadar denerseniz deneyin veri temizlemesi bu sorunu tamamen çözemiyor. Hakkaniyeti sağlayacak bir çözüm bulmak sadece zor değil, matematiksel olarak da imkansız.
YZ'nin tarihsel ön yargıları yansıtan veya ön yargının içeri sızmasına izin veren başka bir örneğiyle ilgili haberlerin yayınlanmadığı bir gün neredeyse olmuyor. Tıp bilimi bile bundan muaf değil: The Lancet'te yakın zamanda yayınlanan bir makalede araştırmacılar, titizlikle anonimleştirilmiş tıbbi görüntüleme verileriyle beslenen YZ algoritmalarının yine de hastaların yüzde 93'ünün ırkını tanımlayabildiğini gösterdi.
İş dünyası liderleri, YZ ön yargısını ortadan kaldırabileceklerini iddia etmeyi bırakmalı -bunu yapmaları mümkün değil- ve bunun yerine ön yargıyı düzeltmeye odaklanmalı. Oliver Wyman'da kurumsal ve kamusal müşterilere danışmanlık yaparken, YZ'nin kötü davranma olasılığını azaltmak isteyen liderler için olumlu sonuçlar verebilecek üç adımlı bir süreç belirledik.
ADIM: VERİ VE TASARRUFA KARAR VERİN
Tam bir hakkaniyet imkansız ve bir çok karar verme komitesi henüz yeterince çeşitlilik içermiyor. Bu nedenle hakkaniyette kabul edilebilir eşiği seçmek ve kime öncelik verileceğini belirlemek zor bir iş. YZ'de hakkaniyeti sağlamak için tüm şirketler veya tüm durumlara uygun tek bir standart veya plan yok. Ekipler, algoritmalarının korunan her sınıftan eşit sayıda insan seçip seçmediğini, her gruptan aynı oranı seçip seçmediğini veya herkes için aynı eşiği kullanıp kullanmadığını kontrol edebilir. Tüm bu yaklaşımlar savunulabilir ve yaygın bir şekilde kullanılıyor ancak her bir insan sınıfından eşit sayıda insan, başlangıçta girdi verilerine dahil edilmedikçe, bu seçim yöntemleri birbirini dışlar. Seçilen 'hakkaniyet' türü kaçınılmaz olarak bir ödün vermeyi gerektirir, çünkü sonuçlar herkes için hakkaniyetli olamaz.
YAKLAŞIM SEÇİMİ DOĞRU YAPILMALI
O halde yaklaşım seçimi kritik öneme sahip. Bir şirket, korunacak grupları seçmenin yanı sıra hafifletilmesi gereken en önemli meselenin ne olduğunu belirlemeli. Mesele, grupların büyüklüklerindeki farklılıklar mı, yoksa gruplar arasındaki farklı doğruluk oranları mı? Grup büyüklükleri için hakkaniyet, her grup türünden eşit bir sayı mı yoksa orantılı bir yüzde mi talep ediyor? Farklı doğruluk oranları için, veriler doğru bir şekilde etiketlendi mi ve eğer öyleyse, hangi grubun en öngörücü eşitliğe ihtiyacı var? Bu çeşitli seçenekler, pek çok yolun -belirli grupların korunmasını sağlamak gibi- şirket politikasıyla uyumlu hale getirilmesini ve standartlaştırılmasını gerektiren bir karar ağacıyla sonuçlanır.
Yanlış adımlar hala yaygın. Örneğin bir Avrupalı yazılım şirketi, yakın zamanda satış aramalarını yeniden yönlendirmek için ses işlemeli YZ yazılımı oluşturdu ve büyük başarı elde etti. Arayanların bölgesel aksanlara sahip olduğu durumlar dışında. Bu durumda, daha çeşitli bir test grubu oluşturarak ve yanlış sınıflandırma riskinin farklı bölgesel gruplar için aynı olması sağlanarak hakkaniyet kontrol edilebilirdi. Algoritmaları şekillendiren geliştirme ve test veri setlerinin yeterince çeşitli olmasını sağlamak için şirketlerin farklı hassas özelliklerin kapsamını kontrol etmesi ve verilerin seçim süreci tarafından önyargılı hale getirilme yön- temlerini yönetmesi gerekiyor. Nihai algoritma ve hakkaniyet testleri, yalnızca erken engelleri geçenleri değil, tüm nüfusu dikkate almalı. Bunu yapmak için model tasarımcılarının verilerin kusurlu olduğunu kabul etmesi gerekiyor.
2. ADIM: ÇIKTILARI KONTROL EDİN
Bir şirket sağlam bir veri ve tasarım yaklaşımına sahip olduğunda, veri türleri arasındaki kesişmeler ve örtüşmeler dahil olmak üzere çıktı ve etkide hakkaniyeti kontrol etmesi gerekiyor. Şirketler iyi niyetli olsalar bile, kötü düşünülmüş bir yaklaşımın yarardan çok zarar getirme tehlikesi bulunuyor. Algoritmalar dizi ötesi (superliteral) olduğu için kesişim kümeleriyle başa çıkmakta pek iyi değil. Bu nedenle görünüşte tarafsız olan algoritmalar, farklı gruplar üzerinde farklı etkilere yol açabiliyor. Bir kredi ürününün engelli olsun ya da olmasın kadın ve erkeklere eşit olarak sunulması gerektiğini söylediğimizde bir algoritmanın çözümü erkek tekerlekli sandalye kullanıcılarını ve sadece engelli olmayan kadınları seçmek olabilir. Bu, eşit sayıda erkek, kadın, engelli ve engelli olmayan kişinin verilere dahil edildiği, ancak engelli kadınların asla seçilemeyeceği anlamına gelir.
Etkili stratejilerden biri, üretken çekişmeli ağlar yaklaşımı gibi iki modelli bir çözüm. Bu, orijinal model ile onun hasmı veya denetçisi olarak işlev gören ve bireysel hakkaniyeti kontrol eden ikinci bir model arasındaki ödün vermeyi kapsayan veya sıfır toplamlı karşılaştırma. İki model kaynaştırıldığında birleşerek daha uygun ve hakkaniyetli bir çözüm üretiyor.
Bu yaklaşım, geleneksel olarak risk havuzlarını kullanan sigorta fiyatlandırmasında özellikle başarılı oluyor. Günümüzde çekişmeli modelleme gibi daha gelişmiş teknikler, bireyi daha iyi yansıtan bir fiyatlandırmaya yönelmiş durumda. Örneğin bir İngiliz sigorta şirketi, kesişimsel hakkaniyeti geliştirmeyi ve kasıtsız ön yargı riskini o kadar etkili bir şekilde azaltmayı başardı ki başvuran beş kişiden dördünün primlerini azalttı.
3. ADIM: SORUNLARI İZLEYİN
Çıktıları sık sık incelemek ve sürekli olarak şüpheli örüntüler aramak önemli. Tüm testleri geçen bir model, gerçek dünya girdileri, özellikle zaman içinde ilerleyen girdiler kullanılarak uygulandığında yine de istenmeyen sonuçlar üretebilir.
İnsanlar ön yargıya alıştı, bu yüzden nadiren fark ediyor. Tamamıyla çeşitlilik içeren bir sonuç şaşırtıcı görünebiliyor. Bu nedenle insanlar YZ geliştirirken istemeden önyargıyı güçlendirebiliyor. Örneğin, eşit bir dünyada, seçilen birçok komite üyesinin tamamı kadın olacaktır, tıpkı bazılarının tamamen erkek olması gibi.
Benzer şekilde, çoğu insan nadir olayların gerçekleşmemesini bekliyor. Nadir olaylar, kalıpları basitleştirmek ve genelleştirmek için tasarlanmış bir beynin tipik olarak bekleyeceği gibi, gerçekten de olasılık dışı ve nadir olsa da imkansız değil. İnsanlar sıklıkla, nadir görülen bir şey gerçekleştiğinde itiraz eder; gerçekleşmediğinde etmez. Ancak şirketler bu yokluğa karşı savunma yapmıyor ve bunu fark etmeleri bile olası değil. İnsanlar sezgisel olarak, nadir olayların eşit aralıklarla gerçekleşmesini, arka arkaya iki kez meydana gelmemesini ister; dolayısıyla düşük frekanslar dikkatten kaçar ve mükemmel rastgelelik şüphe uyandırır.
ÖNGÖRÜLER YÖN VERİYOR
Öngörücü faktörler, bu statükoyu esas alıyor, bu yüzden yanlış. Erkeklerin maaşlarının yüksek olması, belirli bir dizi mesleği icra etmesi ve kayıtlı bilgilerinde bir cep telefonu numarası bulunması halinde bir krediyi geri ödeme olasılığı daha yüksek. Bu faktörlerin hiç biri kadınlar için aynı öngörücü ilişkiye sahip değil, ancak veri setinde kadından fazla erkek varsa, o zaman kadınları değerlendiren bir modelde erkek öngörücü faktörler kullanılır.
Benzer şekilde, yanlış sınıflandırma veya hata oranları, daha az verinin mevcut olduğu azınlık gruplarında her zaman en yüksek olacaktır. Araştırmalar, çok az sayıda klinik denemenin yeterli sayıda azınlık grubu üyesi içerdiğini gösteriyor. Bu da azınlık grubu üyelerinin tedavi sonuçlarının, genellikle denemelere katılmaya gönüllü olan üniversite çağındaki beyaz erkekler kadar doğru bir şekilde öngörülememesine yol açıyor. Aynı ön yargı, pazarlama algoritmalarında, fiyatlandırmada, kredi kararlarında, metin okuyucularında ve dolandırıcılık tespit sistemlerinde de bulunuyor. Birçok şirket, insanlar doğrudan dezavantajlı durumda olmadığında bile, bir alt grubu hafife almanın şirkete ticari bir etkide bulunduğunu keşfetti.
TAKİBİ BIRAKMAYIN
Sürekli izleme büyük faydalar sağlayabilir. Örneğin küresel bir perakendeci, verilerdeki değişikliklere uyum sağlayarak ve öngörüleri etkileyen tarihsel yanlılığı mevsimsel ilgi değişse bile düzelterek talep tahminini iyileştirmeyi başardı. Bu artan doğruluk, şirketin doğruluğu tarihsel verilere uydurma yeteneği olarak tanımlamaktan vazgeçmesiyle tedarik zincirlerini iyileştirmesine ve pazara sunma süresini yaklaşık yüzde 10 kısaltmasına olanak sağladı.
Yasal düzenlemeler ve medya denetimi, şirketlerin YZ'lerinin hakkaniyetli olduğunu ispatlamasını gerektirdiğinde, şirketler öyle olduğunu söyleyen bir sonuç ölçüsü üretebilir. Ancak şirketler, algoritmalarının çeşitlilik arz eden bir nüfusta eşitlikçi şekilde çalışmasını gerçekten istiyorsa, hakkaniyeti sağlayacak kasıtlı telafi etme yoluna gitmeli ya da matematiğin yasalarını yeniden yazmalı.
Şirketler hiçbir zaman ön yargıyı tamamen ortadan kaldıramaz. Ancak daha adil, daha çeşitli ve eşitlikçi sonuçlar elde etmek için uygulamalarını geliştirebilir, genişletebilir, kontrol edebilir ve düzeltebilir.
-Sian Townson: Küresel danışmanlık şirketi Oliver Wyman'ın dijital uygulamasının ortaklarından biri. Matematiksel modelleme alanında Oxford'dan doktorası bulunuyor.