Sözlük

Topluluk

Topluluk yöntemleriyle tahmin doğruluğunu artırın! Birden fazla modeli birleştirmenin nesne algılama, NLP ve daha birçok alanda performansı nasıl artırdığını öğrenin.

Topluluk yöntemleri, makine öğreniminde (ML) birden fazla bireysel modelin tek ve üstün bir tahmin modeli üretmek için birleştirildiği güçlü bir tekniktir. Temel fikir, birkaç modelin "bilgeliğini" bir araya getirerek, nihai tahminin herhangi bir tekil modelden elde edilen tahminden daha doğru, istikrarlı ve sağlam olacağıdır. Bu yaklaşım, farklı uzmanlardan oluşan bir gruptan tavsiye almaya benzer; kolektif karar genellikle herhangi bir uzmanın görüşünden daha iyidir. Bu teknikler, aşırı uyumu azaltmada ve görülmeyen veriler üzerinde modellerin genelleştirilmesini iyileştirmede oldukça etkilidir.

Topluluklar Nasıl Çalışır?

Topluluk öğrenimi iki ana adımdan oluşur: bir grup farklı temel modelin eğitilmesi ve ardından tahminlerinin birleştirilmesi. Temel modeller arasındaki çeşitlilik çok önemlidir; tüm modeller aynı hataları yaparsa, topluluk herhangi bir gelişme sağlamayacaktır. Bu çeşitlilik, farklı algoritmalar kullanılarak, eğitim verilerinin farklı alt kümeleri üzerinde eğitim yapılarak veya farklı hiperparametreler kullanılarak elde edilebilir.

Modeller eğitildikten sonra tahminleri toplanır. Sınıflandırma görevleri için bu genellikle bir oylama mekanizması aracılığıyla yapılır (örneğin, en çok oyu alan sınıf kazanır). Regresyon görevleri için tahminlerin tipik olarak ortalaması alınır. Sonuçta ortaya çıkan birleşik model, Condorcet Jüri Teoremi'nde incelenen bir kavram olarak genellikle daha iyi performans sergiler.

Yaygın Topluluk Teknikleri

Etkili topluluklar oluşturmak için çeşitli popüler yöntemler mevcuttur:

  • Bagging (Bootstrap Toplama): Bu teknik, eğitim verilerinin farklı rastgele alt kümeleri üzerinde birden fazla modelin (örn. karar ağaçları) eğitilmesini içerir. Rastgele Orman algoritması iyi bilinen bir torbalama uygulamasıdır.
  • Güçlendirme: Modeller sırayla eğitilir ve her yeni model kendinden öncekiler tarafından yapılan hataları düzeltmeye odaklanır. Öne çıkan artırma algoritmaları arasında AdaBoost, Gradient Boosting, XGBoost ve LightGBM yer alır.
  • İstifleme (İstiflenmiş Genelleştirme): Bu yöntem, birkaç farklı modelin (temel öğreniciler ) eğitilmesini ve tahminlerini en iyi şekilde nasıl birleştireceklerini öğrenmek için başka bir makine öğrenimi modelinin (bir meta öğrenici) kullanılmasını içerir.
  • Oylama ve Ortalama Alma: Bunlar, nihai tahminin çoğunluk oyu (sert oylama) veya tüm modellerden tahmin edilen olasılıkların ortalaması (yumuşak oylama) olduğu en basit yöntemlerdir. Ultralytics YOLO modelleri, model birleştirme özelliği ile bir tür ortalamayı destekler.

Gerçek Dünya Uygulamaları

Topluluk yöntemleri, yüksek doğruluğun çok önemli olduğu kritik uygulamalarda yaygın olarak kullanılmaktadır:

  1. Tıbbi Görüntü Analizi: Tümör tespiti gibi görevlerde, bir Evrişimsel Sinir Ağları (CNN'ler) topluluğu kullanılabilir. Her CNN, farklı tıbbi tarama alt kümeleri üzerinde veya farklı mimarilerle eğitilmiş olabilir. Sistem, çıktılarını birleştirerek daha güvenilir ve doğru bir teşhis elde edebilir ve tıbbi görüntüleme gibi uygulamalarda yanlış negatif veya pozitif riskini azaltabilir.
  2. Otonom Sistemler: Otonom araçlar için güvenilir nesne tespiti bir güvenlik meselesidir. Bir topluluk, YOLOv8 ve YOLO11 gibi farklı modelleri veya farklı veri artırma stratejileriyle eğitilmiş modelleri birleştirebilir. Bu yaklaşım, tek bir modelin bir yaya veya engeli tespit edememe riskini azaltarak daha sağlam bir algılama sistemi sağlar.

Topluluk ve İlgili Kavramlar

Topluluk yöntemlerini diğer ilgili kavramlardan ayırmakta fayda vardır:

  • Model Topluluk: Bu terim genellikle "Ensemble" ile birbirinin yerine kullanılır. "Ensemble" genel tekniği ifade ederken, bir Model Ensemble tipik olarak belirli eğitimli model örneklerinin birleştirilmesinin pratik uygulamasını ifade eder. Altta yatan prensip aynıdır.
  • Uzmanlar Karışımı (MoE): Her ikisi de birden fazla model kullansa da mekanizmaları farklıdır. Bir topluluk, her girdi için tüm modellerden gelen tahminleri birleştirir. Buna karşılık, bir Uzmanlar Karışımı (MoE) modeli, her bir tahmin için yalnızca bir model alt kümesi kullanarak belirli bir girdi için en uygun "uzman" modeli dinamik olarak seçmek için bir geçit ağı kullanır.

Topluluklar, model eğitimi ve dağıtımına karmaşıklık ve hesaplama ek yükü eklerken, performans kazanımları genellikle maliyeti haklı çıkarır. Ultralytics HUB gibi platformlar, PyTorch veya TensorFlow gibi çerçevelerle oluşturulmuş birden fazla modelin yönetimini kolaylaştırarak güçlü toplulukların oluşturulmasını basitleştirebilir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı