FEDERE OTOMATİK ÖĞRENMEDEN YARARLANMAK

17.03.2025
YAPAY ZEKA MODELLERİNİ EĞİTMEK İÇİN İŞ BİRLİĞİNE DAYALI BİR YAKLAŞIM DAHA İYİ SONUÇLAR VEREBİLİYOR, ANCAK BU KENDİ VERİLERİNİZİ TAMAMLAYAN VERİLERE SAHİP ORTAKLAR BULMAYI GEREKTİRİYOR. José Parra-Moyano, Karl Schmedders & Maximilian Werner

Günümüzde, yapay zeka (YZ) kullanmak artık rekabet avantajı sağlamayı garanti etmiyor. Şirketleri gerçekten diğerlerinden ayıran şey, YZ sistemlerinin performansını rakiplerininkine kıyasla artıran çeşitli, kapsamlı, yüksek kaliteli verilere erişim. Ancak veri gizliliğine ilişkin endişeler, analiz için benzersiz ve ilgili verilerin kullanımını sınırlayabiliyor.

Bu sorun, gizliliği koruyan federe öğrenme yoluyla hafifletilebilir. Bu teknik, özel bir şifreleme türü ile birlikte, bir YZ modelinin veya başka herhangi bir algoritmanın farklı organizasyonlar tarafından kontrol edilen birden fazla, merkezsizleştirilmiş sunucudan gelen veriler kullanılarak eğitilmesini sağlar. Ve tüm bunlar, eğitim için verileri kullanılan bireylerin veya organizasyonların gizliliğine saygı gösterilerek yapılır. Basitçe ifade etmek gerekirse, federe öğrenme, veriyi algoritmaya göndermek yerine algoritmayı veriye göndermeyi gerektirir.

İsviçre merkezli Zurich Insurance Group, bir İngiliz telekomünikasyon şirketi olan Orange'dan aldığı verilerle bir tahmin algoritmasını bu şekilde geliştirebildi. Ticari bir federe öğrenme platformu kullanılarak Zurich'in algoritması eğitilebildi ve Orange'ın herhangi bir veriyi serbest bırakmasına gerek kalmadan tahmin yetenekleri geliştirilebildi. İş birliği, YZ sisteminin tahminlerinde yüzde 30'luk bir iyileşme sağladı ve bu da Zurich için önemli bir gelir artışına dönüştü. Orange için ise söz konusu iş birliği, gizliliğini korurken verilerinden para kazanmanın yeni bir yolunu temsil ediyordu.

Sektörler Arasında ve Dahilinde Federe Öğrenme

Organizasyonlar, rekabet avantajı sağlayacağını umdukları YZ sistemlerini eğitmek için daha fazla veri aradıkça, federe öğrenmenin gerçek uygulamaları hızla ortaya çıkıyor. Örneğin büyük bir bankanın kredi birimi, en büyük küresel telekomünikasyon şirketlerinden birine ait verileri kullanarak kredi temerrütlerini tahmin etme algoritmasına ince ayar yaparken bu yaklaşımdan yararlandı ve tahmin doğruluğunu yaklaşık yüzde 10 oranında artırdı.

Bu tür iş birliklerinin değeri, YZ sistemlerini herhangi bir organizasyonun kendi başına bir araya getirebileceğinden çok daha zengin veri setleri üzerinde eğitme yeteneğinden kaynaklanıyor. Bunu yapmak için organizasyonların YZ sistemlerinin performansını artırmak amacıyla verilerini federe öğrenme yaklaşımında kullanabileceği ortakları tespit etmesi gerekiyor.

Farklı sektörlerden organizasyonların birbirleriyle iş birliği yapması aynı sektördeki şirketlerden daha mantıklı görünse de, federe öğrenme sektör içi iş birliğini de kolaylaştırabilir; doğrudan rakipler arasındaki iş birliği de dahil olmak üzere...

Kendi başlarına sağlam veri setleri derlemekte zorlanan rakip özel hastanelerdeki bazı patoloji bölümleri tam da bunu yapıyor. Bölümler, kendi veri setlerinin, örneğin hastalık için analiz edilecek fiziksel doku görüntülerinin bir birleşimini kullanarak ortak bir teşhis algoritması eğitiyor. Sonuç olarak, tüm katılımcı hastaneler, daha küçük, kurum içi veri setlerine güvenmeleri durumunda mümkün olandan çok daha yüksek performansa sahip, değerli ve potansiyel olarak hayat kurtarıcı iç görüler sağlayan bir algoritmadan yararlanmış oluyor.

Federe öğrenmenin mümkün kıldığı gizliliği koruyan iş birliği, hastaneler için yeni bir tür veri odaklı iş modeliyle sonuçlanabilir. Ortaklaşa geliştirilen, kolektif olarak sahip olunan algoritmanın mülkiyet payları, her hastanenin verilerinin doğruluğa katkısına göre belirlenir. Bu algoritma aynı zamanda ticarileştirilebilir ve diğer hastaneler gibi üçüncü taraflara kiralanabilir ve elde edilen gelir hastanelerin ilgili mülkiyet paylarına göre bölüşülebilir.

Finans sektörü, rakip organizasyonların federe öğrenmenin faydalarından yararlanmasını sağlayan başka bir yaklaşım benimsiyor. Çok taraflı homomorfik şifreleme adı verilen bir şifreleme sistemiyle birlikte kullanıldığında, her katılımcı banka, sahip olduğu ya da olmadığı müşteriler hakkında diğerlerini bilgilendirmeden, bir müşterinin rakip bir banka tarafından güvenilmez ya da başka bir şekilde sorunlu bir müşteri olarak işaretlenip işaretlenmediğini kontrol edebiliyor. Bu, şu anda küresel olarak bankaların operasyonel maliyetlerinin yaklaşık yüzde 3'ünü oluşturan "müşterini tanı" sürecinin maliyetini azaltıyor ve müşteriye daha iyi bir deneyim sağlıyor.

Çok sayıda hastane, dermatolojik teşhise yönelik bir otomatik öğrenme modelini farklı ülkelerde bulunan birden fazla veri setinde güvenli bir şekilde eğitmek için aynı tür şifreli bilgi işlem platformunu kullanıyor. Diğer hastaneler ise bu platformu tanımlayıcı istatistikler üretmek üzere daha basit dağıtılmış analitikleri çalıştırmak için kullanıyor ve böylece mevcut en son verilere dayanarak sağlıklı insanlar ve hastalar için kişiselleştirilmiş referans aralıkları elde edebiliyor. Bu sayede doktorlar, hastalarını teşhis etmek için herkese uyacak tek bir referansa bel bağlamak zorunda kalmadan kişiselleştirilmiş eşikleri kullanabiliyor.

Federe öğrenme, veriyi algoritmaya göndermek yerine algoritmayı veriye göndermeyi gerektirir.

Veri Tamamlayıcılığı ve Hacmine İlişkin Gerekler

İş liderlerinin hangi harici organizasyonlarla ortaklık yapılacağını değerlendirirken kendi organizasyonlarının iş birliğine getirebileceği verilerin niteliğini göz önünde bulundurması gerekiyor. Belirli bir modeli eğitmek için kullanılan veriler çok sayıda örnek (müşteriler, hastalar, sigorta poliçeleri ya da sistemin anlamayı amaçladığı şey her ne ise) ve her bir örnekte de çok sayıda özellik (değişken) içermeli.

Örnek sayısı ve örnek başına özellik sayısı, organizasyonların federe öğrenme tekniklerini kullanarak fayda elde edebileceği iki boyut. Birinci boyut olan olan yatay federe öğrenme, modelin eğitildiği örnek sayısının artırılmasını gerektiriyor. İkinci boyut olan dikey federe öğrenme, modelin her bir örnek için analiz ettiği özelliklerin sayısının artırılmasını içeriyor. Bu iki boyut, iş liderlerinin federe öğrenme ortamını keşfederken kendini içinde bulabileceği dört durumu ortaya çıkarıyor. (Bkz. "Federe Öğrenme İçin Dört Veri Türü.")

Çok sayıda örneği barındıran ancak her örneğin az sayıda özelliğe sahip olduğu bir veri seti dikey veri olarak adlandırılır ve zengin veri haline getirilmesi dikey öğrenme gerektirir. Benzer şekilde, yatay veri az sayıda örnek barındırır ancak her örnek çok sayıda özelliğe sahiptir ve bunun zengin veri haline getirilmesi yatay öğrenme gerektirir. Fakir verilerde, örnek sayısı ve bu örneklerin her biri için özellik sayısı düşüktür.

Bu dört veri türünün ayırt edici özelliklerinin farkında olmayan iş dünyası liderleri, kendilerini fakir veriden yatay veya dikey veriye götürebilecek, ancak veriyi zengin veriye dönüştüremeyecek federe öğrenme işbirlikleri kurma riskiyle karşı karşıya. Fakir veriyle yola çıkıp dikey veya yatay veriye ulaşmak cazip görünebilir, ancak bu performans artışıyla sonuçlanmayabilir. Örneğin bir hastane, çok daha fazla hastaya ait verileri, bu hastalara ait yeni ilgili özellikleri eklemeden sete dahil ederek fakir veriyi dikey veriye dönüştürebilir. Ancak bu durumda, hastalıkla pozitif korelasyon gösteren özellikleri izole edemeyeceği için teşhis YZ aracının tahmin gücünü artıramayabilir.

Benzer şekilde, YZ'nin değerli içgörüler üreten anlamlı kalıplar bulmak için ilgili özelliklerde yeterli çeşitliliğe ihtiyaç duyduğu göz önüne alındığında, fakir veriden yatay veriye geçmek de herhangi bir avantaj yaratmayabilir.

Dolayısıyla, iş liderlerinin federe bir öğrenme projesinde harici bir organizasyonla iş birliği yapıp yapmamayı ele alırken kendilerine "Verilerimin durumu nedir—fakir mi, dikey mi, yatay mı, yoksa zengin mi?" diye sorması gerekiyor. Bu soru, verilerin dikey ve yatay boyutları değerlendirilerek yanıtlanabilir. (Bkz. "Yatay veya Dikey Verilerden Zengin Veri Oluşturmak")

Dikey boyut, örnekteki gözlem sayısının tüm popülasyonu temsil edip etmediğine bakılarak değerlendirilir. "Popülasyonun ya da gerçekliğin tüm kesimleri örneğimizde temsil ediliyor mu?" benzeri bir soru, verilerin dikey olarak kabul edilmesi için 'evet' olarak yanıtlanmalı. Yatay boyut, örnekteki gözlemlerin her biri hakkında mevcut olan değişkenlerin tek bir gözlemin davranışını açıklamak için yeterli olup olmadığı göz önünde bulundurularak değerlendirilir. "Örneğimizdeki bireylerin, haklarında kaydettiğimiz tüm değişkenleri göz önünde bulundurduğumuzda, nasıl davranacaklarını anlıyor muyuz?" benzeri bir soru, verilerin yatay olarak kabul edilmesi için 'evet' olarak yanıtlanmalı. Her iki soruya da "evet" yanıtı verilmesi zengin veriye işaret eder. Her iki soruya da "hayır" yanıtı verilmesi fakir verinin işaretidir.

Veri dikey ise başka sektörlerde ortak organizasyonlar aramak doğru yol olabilir, müşterilere farklı hizmetler sunan organizasyonların bu müşteriler hakkında farklı veriler kaydettiği göz önüne alınarak. Bu durumu Orange-Zurich örneği net bir şekilde ortaya koyuyor—telekom şirketi müşterilerin iletişim ve mobilite verilerine; sigorta şirketi ise riskten kaçınma, tüketim ve anlamlı yaşam olaylarına ilişkin verilere sahip.

Veri yatay ise aynı sektördeki organizasyonlara yönelmek doğru yol olabilir, çünkü böyle bir durumda veri setini zenginleştirmek için daha fazla örneğe ihtiyaç var.

Veri fakirse organizasyonun bir veri kaydetme süreci başlatması gerekir. Bu durumda doğru strateji, diğer organizasyonların halihazırda kaydetmiş olduğu verileri incelemek ve bu organizasyonlardan biri veya daha fazlası için tamamlayıcı olabilecek—organizasyonların dikey veya yatay veri setlerini zenginleştirebilecek—verileri kaydetmektir.

Veri zenginse, organizasyon zaten kendi veri seti aracılığıyla YZ'nin gücünden yararlanabilecek konumdadır. Ancak federe öğrenmenin hala sunabileceği bir şey var: Veri setinin tam sahipliğini korurken diğer harici organizasyonların YZ sistemlerinin eğitimine katkıda bulunarak bu zengin veriden para kazanma fırsatı. Mayo Clinic'in küresel, federe kimliksizleştirilmiş verilere erişim sunan bir program olan Solutions Studio aracılığıyla yaptığı şey de bu.

Federe öğrenmenin ilginç ve genellikle keşfedilmemiş bir uygulama alanının "organizasyon içi" olduğunu belirtmek gerekiyor. Uyumluluk veya etik nedenlerle uygulanan veri paylaşım engelleri ve farklı tüzel kişilikler veya yasal yetki alanları, bazı grupların kendi şirketlerinin sahip olduğu verilere erişimini kısıtlayabilir. Federe öğrenme, bir organizasyonun veri paylaşımı kısıtlamalarına uymaya devam ederken bu tür kısıtlamaları aşarak verilerinden tam anlamıyla istifade etmesine olanak tanır.

İş liderlerinin federe bir öğrenme projesinde harici bir organizasyonla iş birliği yapıp yapmamayı ele alırken kendilerine "Verilerimin durumu nedir? Fakir mi, dikey mi, yatay mı, yoksa zengin mi?" diye sorması gerekiyor.

Federe Öğrenmenin Başarısının Önündeki

Engellerin Aşılması

İş liderlerinin tamamlayıcı verilere sahip olan organizasyonları belirlemesinin ardından hala aşılması gereken ek engeller mevcut; yapılandırılmamış verilerin kullanılabilir bir formata dönüştürülmesi gibi. Fakslar, PDF dosyaları ya da elle yazılmış ve taranmış raporlar gibi kaynaklardan gelen yapılandırılmamış verilerin düzenlenmesi ve makinede okunabilir hale getirilmesi gerekir. İş liderleri, ileride YZ sistemlerini eğitecek teknik ekiplerle iş birliği içinde bu tür bir yapılandırmanın maliyetlerini önceden görmeli ve tahmin etmeli.

Farklı etiketler başka bir sorun olabilir. Farklı organizasyonlar genellikle aynı özelliği ifade etmek için farklı terimler kullanır, bu nedenle işbirliği yapan organizasyonların veri kataloglarının muhtemelen senkronize edilmesi gerekecektir; bu da YZ sistemini eğitmek için gereken süreyi uzatabilir. İş liderlerinin girişimlerin ne zaman sonuç vermeye başlayacağını öngörürken bunu hesaba katması gerekir.

Ancak en kritik zorluk insanlar ve onların korkularıdır. Harici organizasyonlarla, özellikle de rakiplerle işbirliğine karşı sergilenen direnç, federe öğrenmenin keşfedilmesini ve uygulanmasını engelleyebilir.

Bu nedenle, federe otomatik öğrenme mimarilerini uygularken iş birliği yapan muhtelif organizasyonlardan bireylerin birbirleriyle aktif bir şekilde etkileşime girmesi büyük önem taşır. Bu, tek bir organizasyon dahilinde yürütülse bile tüm dijitalleştirme süreçleri için geçerlidir; ancak farklı kurumsal kültürlere ve kaygılara sahip birden fazla organizasyonun dahil olduğu federe öğrenme bağlamında özellikle geçerlidir.

Federe öğrenme, bir organizasyonun veri paylaşımı kısıtlamalarına uymaya devam ederken bu tür kısıtlamaları aşarak verilerinden tam anlamıyla istifade etmesine olanak tanır.

Federe öğrenme konusunda hangi organizasyonlarla iş birliği yapılacağına karar verirken iş liderlerinin göz önüne alması gereken altı temel faktör bulunuyor:

1. Şirketlerinin verilerinin durumu: Liderler, işbirliği yapacakları harici organizasyonları aramadan önce şirketlerinin kendi verilerinin fakir, dikey, yatay veya zengin olup olmadığını belirlemeli. Bu, ne tür organizasyonlarla işbirliği yapmaları gerektiğine karar vermelerine yardımcı olacaktır.

2. Şirketlerinin verilerinin yapısı.: Dikey verilere sahip organizasyonlar kendi sektörlerinin dışına bakmalı. Yatay veriye sahip olanlar ise kendi sektörleri içinde—hatta potansiyel olarak rakipleriyle iş birliği aramalı.

3. Mantıklı bir başlangıç noktası: Federe öğrenmeyi güvenli bir şekilde keşfetmek için organizasyon sınırları dahilinde bile olsa belirli bir algoritma ve güvenilir bir ortakla işe başlayın.

4. Verilerden para kazanma potansiyeli: Federe öğrenme, organizasyonların başkalarının YZ eğitim süreçlerine katkıda bulunarak verilerinden para kazanması için gizlilik merkezli bir yöntem sunuyor. Bu verilere ihtiyaç duyan ortak organizasyonların belirlenmesi, bu tür çabalar için büyük önem taşıyor.

5. Mümkün teknik zorluklar: Farklı organizasyonlar arasında veri formatlarının ve yapılarının uyumlandırılması gibi teknik zorlukların ve maliyetlerin farkına varın ve bunlar için önceden plan yapın.

6. Çalışanların katılımı: İnsanların etrafında değil, onlarla birlikte çalışın. Federe öğrenme dönüşümsel bir yaklaşım gerektiriyor. Bunun için de yaygın bir katılım ve açıkça belirlenmiş roller ve kaynaklar olmalı.

Rekabet avantajı elde etmek veya bunu sürdürmek isteyen organizasyonlar için hazır bir YZ çözümünü kullanmak yeterli olmayacaktır. Üstün performans arayan organizasyonların YZ sistemlerini özel verilerle eğitmesi ve ince ayar yapması gerekiyor. Federe öğrenme, bir organizasyonun bunu harici ortaklardan gelen verileri kullanarak yapmasına imkan tanıyor.

José Parra-Moyano, İsviçre'nin Lozan kentindeki Uluslararası Yönetim Geliştirme Enstitüsü'nde (International Institute for Management Development/IMD) dijital strateji profesörü. Karl Schmedders, Lozan'daki IMD'de finans profesörü. Maximilian Werner, IMD'nin Lozan'daki Girişim Varlık Yönetimi inisiyatifinde yardımcı direktör ve araştırma görevlisi.

X
Sitelerimizde reklam ve pazarlama faaliyetlerinin yürütülmesi amaçları ile çerezler kullanılmaktadır.

Bu çerezler, kullanıcıların tarayıcı ve cihazlarını tanımlayarak çalışır.

İnternet sitemizin düzgün çalışması, kişiselleştirilmiş reklam deneyimi, internet sitemizi optimize edebilmemiz, ziyaret tercihlerinizi hatırlayabilmemiz için veri politikasındaki amaçlarla sınırlı ve mevzuata uygun şekilde çerez konumlandırmaktayız.

Bu çerezlere izin vermeniz halinde sizlere özel kişiselleştirilmiş reklamlar sunabilir, sayfalarımızda sizlere daha iyi reklam deneyimi yaşatabiliriz. Bunu yaparken amacımızın size daha iyi reklam bir deneyimi sunmak olduğunu ve sizlere en iyi içerikleri sunabilmek adına elimizden gelen çabayı gösterdiğimizi ve bu noktada, reklamların maliyetlerimizi karşılamak noktasında tek gelir kalemimiz olduğunu sizlere hatırlatmak isteriz.