Federe Öğrenme, algoritmaları birden fazla merkezi olmayan uç cihazda veya yerel veri örneklerini tutan sunucularda, ham verilerin kendisini değiştirmeden eğitmek için tasarlanmış bir Makine Öğrenimi (ML) tekniğidir. Bu yaklaşım, merkezi olarak toplanamayan veya toplanmaması gereken veri kümelerini kullanarak işbirliğine dayalı model eğitimine olanak tanıyarak Veri Gizliliği, güvenlik ve veri erişim hakları ile ilgili kritik endişeleri doğrudan ele alır. Federated Learning, verileri merkezi bir modele getirmek yerine, model eğitim sürecini genellikle akıllı telefonlar veya hastane sunucuları gibi Edge AI cihazlarında bulunan verilerin bulunduğu yere getirir. Bu, daha güvenli ve gizlilik bilincine sahip Yapay Zekaya (AI) doğru bir geçişi temsil eder.
Federe Öğrenmenin Temel Kavramları
Federe Öğrenme, tipik olarak merkezi bir sunucu veya koordinatör tarafından yönetilen yinelemeli bir süreç aracılığıyla çalışır:
- Başlatma: Merkezi sunucu başlangıçta global bir modelle başlar (örneğin, genel bir Ultralytics YOLOnesne algılama için model).
- Dağıtım: Bu global model bir dizi istemci cihaza (örn. cep telefonları, yerel sunucular) gönderilir.
- Yerel Eğitim: Her istemci cihaz kendi yerel verilerini kullanarak alınan modeli eğitir. Bu veriler cihazı asla terk etmediği için gizlilik korunur. Bu adım yerel hesaplama kaynaklarını kullanır.
- Güncelleme İletimi: İstemciler ham veri göndermek yerine sadece güncellenmiş model parametreleriniweights and biases) veya hesaplanmış gradyanları merkezi sunucuya geri gönderir. Daha fazla güvenlik için burada güvenli toplama ve diferansiyel gizlilik gibi teknikler uygulanabilir.
- Toplama: Merkezi sunucu, paylaşılan global modeli iyileştirmek için katılımcı istemcilerden gelen güncellemeleri toplar (örneğin, ağırlıkların ortalamasını alarak).
- Yineleme: Küresel model istenen performans seviyesine ulaşana kadar 2-5. adımlar tekrarlanır ve genellikle YOLO Performans Ölçütleri gibi kılavuzlarda tartışılan standart ölçütler kullanılarak değerlendirilir.
Bu süreç, küresel modelin kullanıcı gizliliğinden ödün vermeden birçok konuma dağıtılmış geniş ve çeşitli veri yelpazesinden öğrenmesini sağlar. Daha fazla bilgi için Federated Learning araştırma ve uygulamalarını inceleyebilirsiniz.
Birleştirilmiş Öğrenime Karşı Dağıtılmış Eğitim
Federated Learning birden fazla makinede eğitimi içerirken, geleneksel Distributed Training'den önemli ölçüde farklıdır:
- Veri Dağıtımı: Dağıtılmış eğitim tipik olarak verilerin merkezi olarak toplandığını ve daha sonra veri merkezi gibi kontrollü bir ortamdaki düğümler arasında dağıtıldığını (genellikle aynı ve bağımsız olarak veya IID) varsayar. Federe Öğrenme, verilerin en başından itibaren merkezi olmadığını ve genellikle IID olmadığını varsayar ve kullanıcılar veya konumlar arasındaki gerçek dünya veri varyasyonlarını yansıtır.
- Gizlilik: Gizliliğin korunması, Federe Öğrenmenin temel hedeflerinden biridir. Dağıtılmış eğitimin birincil hedefi genellikle ölçeklenebilirlik ve hızdır, eğitim sürecinin kendisi sırasında veri gizliliğine daha az odaklanılır.
- Ağ ve Donanım: Dağıtılmış eğitim genellikle yüksek bant genişliğine sahip ağlarda ve daha tek tip donanımlarda çalışırken, Federe Öğrenme güvenilir olmayan ağ bağlantılarını ve istemci cihazların heterojen donanım özelliklerini idare etmelidir.
Federe Öğrenme Uygulamaları
Federe Öğrenme, verilerin hassas, büyük veya doğal olarak dağıtık olduğu senaryolarda özellikle değerlidir:
- Sağlık Hizmetleri: Hassas hasta kayıtlarını paylaşmadan birden fazla hastanede Tıbbi Görüntü Analizi gibi görevler için tanı modellerinin eğitimi. Bu, HIPAA gibi katı gizlilik düzenlemelerine bağlı kalırken çeşitli hasta verilerinden yararlanarak daha sağlam modellerin oluşturulmasına olanak tanır. Sağlık Bilişimi için Federe Öğrenme 'deki örneklere bakın ve Sağlık Hizmetlerinde ilgili Yapay Zeka çözümlerini keşfedin.
- Mobil Cihazlar: Kişisel verileri veya iletişim geçmişini merkezi sunuculara yüklemeden modelleri doğrudan kullanıcıların telefonlarında eğiterek tahmini metin klavyeleri (ör. Google'ın Gboard'u), sesli asistan komut tanıma veya kişiselleştirilmiş öneriler gibi cihaz içi özellikleri geliştirmek.
- Finans: Bankaların gizli müşteri verilerini paylaşmasını gerektirmeden, farklı bankalar tarafından tutulan işlem verileri üzerinde modelleri eğiterek hileli işlemleri tespit etmek.
- Endüstriyel IoT: Potansiyel olarak tescilli operasyonel verileri merkezileştirmeden farklı fabrikalardan veya konumlardan gelen sensör verilerine dayalı olarak makineler için kestirimci bakım modelleri geliştirmek.
Federe Öğrenimin Faydaları
- Gelişmiş Gizlilik: Ham veriler istemci cihazda yerelleştirilmiş olarak kalır ve gizlilik risklerini önemli ölçüde azaltır.
- Azaltılmış İletişim Yükü: Model güncellemelerinin iletilmesi, genellikle tüm veri kümelerinin aktarılmasından çok daha az bant genişliği gerektirir.
- Gerçek Zamanlı Öğrenme: Modeller, uç cihazlardaki en son yerel veriler kullanılarak potansiyel olarak daha sık güncellenebilir.
- Çeşitli Verilerden Yararlanır: Yasal, etik veya lojistik nedenlerle merkezileştirilemeyen daha büyük, daha çeşitli veri kümelerine erişim sağlar ve potansiyel olarak Aşırı Uyumu azaltır.
Federe Öğrenimin Zorlukları
Avantajlarına rağmen, Federated Learning çeşitli engellerle karşı karşıyadır:
- İletişim Verimliliği: Potansiyel olarak binlerce veya milyonlarca cihazdan gelen güncellemeleri koordine etmek ve toplamak, özellikle sınırlı bant genişliği veya güvenilir olmayan bağlantılarda yavaş ve karmaşık olabilir.
- Sistem Heterojenliği: İstemci cihazlar işlem gücü açısından büyük farklılıklar gösterir (CPU/GPU), bellek, ağ bağlantısı ve güç kullanılabilirliği.
- İstatistiksel Heterojenlik: Cihazlar arasındaki veriler tipik olarak IID değildir (özdeş ve bağımsız olarak dağıtılmamıştır), bu da global modeli saptırabilir veya yakınsamayı yavaşlatabilir.
- Güvenlik Endişeleri: Veri gizliliğini artırırken, sistemin kendisi model güncellemelerini hedef alan düşmanca saldırılara veya merkezi sunucudaki potansiyel güvenlik ihlallerine karşı savunmasız olabilir. Genel Veri Güvenliğinin sağlanması önemini korumaktadır.
- Müşteri Yönetimi: Uygun müşterilerin seçilmesi, katılımın yönetilmesi ve vazgeçmelerin ele alınması lojistik zorluklardır.
TensorFlow Federated gibi çerçeveler ve OpenMined gibi kuruluşların kütüphaneleri bu zorluklardan bazılarını ele almayı amaçlamaktadır. Karmaşık olsa da, Federe Öğrenme, büyük ölçekli, gizlilik bilincine sahip yapay zeka sistemleri oluşturmak için umut verici bir yöndür. Ultralytics HUB gibi platformlar, genel Model Dağıtımı ve yönetim yaşam döngüsünü kolaylaştırır ve potansiyel olarak federasyon yaklaşımları kullanılarak geliştirilen modelleri kapsar. Ultralytics ekosistemi içinde çeşitli model dağıtım seçeneklerini keşfedebilirsiniz. FL'yi Aktif Öğrenme gibi diğer tekniklerle birleştirmek de, Aktif Öğrenme bilgisayarla görme gelişimini hızlandırır blog yazısında tartışıldığı gibi, devam eden bir araştırma alanıdır.