Sözlük

XGBoost

Sınıflandırma ve regresyon görevlerinde doğru tahminler için güçlü, hızlı ve çok yönlü makine öğrenimi algoritması XGBoost'u keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Extreme Gradient Boosting'in kısaltması olan XGBoost, hız ve performans için tasarlanmış güçlü ve yaygın olarak kullanılan açık kaynaklı bir makine öğrenimi (ML) algoritmasıdır. Modelleri sırayla oluşturan ve yeni modellerin öncekilerin hatalarını düzelttiği topluluk yöntemleri olan gradyan artırma çerçeveleri ailesine aittir. XGBoost, aşırı uyumu önlemek ve daha hızlı eğitim ve tahmin için hesaplama kaynaklarını optimize etmek için gelişmiş düzenleme tekniklerini ( L1 ve L2 düzenlemesi gibi) dahil ederek geleneksel gradyan artırmayı geliştirir. Bu, özellikle yapılandırılmış veya tablo halindeki verilerle hem sınıflandırma hem de regresyon görevleri için oldukça etkili olmasını sağlar.

Gradyan Güçlendirmeyi Anlama

Özünde XGBoost, Jerome H. Friedman tarafından önemli ölçüde geliştirilen bir teknik olan gradyan artırmanın optimize edilmiş bir uygulamasıdır. Gradient boosting, aşamalı bir şekilde zayıf öğrenicilerden, tipik olarak karar ağaçlarından oluşan bir topluluk oluşturur. Her yeni ağaç, önceki ağaçlar topluluğu tarafından yapılan artık hataları (gerçek ve tahmin edilen değerler arasındaki fark) tahmin etmeye çalışır. XGBoost bu süreci, verimliliği ve model doğruluğunu önemli ölçüde artıran birkaç önemli yenilikle geliştirir.

Temel Özellikler ve Geliştirmeler

XGBoost, standart gradyan artırma algoritmalarına göre çeşitli iyileştirmeler sunar:

  • Düzenlileştirme: L1 (Lasso) ve L2 (Ridge) düzenleme terimlerini amaç fonksiyonuna dahil eder, bu da aşırı uyumu önlemeye yardımcı olur ve model genellemesini iyileştirir.
  • Paralel İşleme: Verimlilik için tasarlanan XGBoost, eğitim sırasında daha hızlı hesaplama için çok çekirdekli GPU 'lardan yararlanabilir.
  • Eksik Değerleri İşleme: Eksik veri değerlerini işlemek için yerleşik bir rutine sahiptir ve verinin kendisinden en iyi imputasyon stratejisini öğrenir.
  • Ağaç Budama: Standart gradyan artırmaya kıyasla daha gelişmiş ağaç budama teknikleri ('max_depth' parametresiyle derinlik öncelikli budama ve kazanca dayalı budama sonrası gibi) kullanır.
  • Yerleşik Çapraz Doğrulama: Kullanıcıların boosting sürecinin her iterasyonunda çapraz doğrulama çalıştırmasına olanak tanıyarak optimum boosting turu sayısını elde etmeyi kolaylaştırır.
  • Önbellek Farkındalığı: Önbellek hiyerarşilerinin farkında olarak donanım kullanımını optimize eder.
  • Esneklik: Standart sınıflandırma ve regresyonun ötesinde çeşitli görevler için uyarlanabilirlik sağlayan özel amaç ve değerlendirme işlevlerini destekler. Bu, etkili hiperparametre ayarlamasına yardımcı olur.

Diğer Algoritmalarla Karşılaştırma

XGBoost tablo verileri için oldukça etkili olsa da, diğer popüler algoritmalardan farklıdır:

  • LightGBM: Özellikle çok büyük veri kümelerinde hızıyla bilinen başka bir gradyan artırma çerçevesi. LightGBM, XGBoost'un seviye bazlı büyümesine kıyasla daha hızlı olabilen ancak bazen daha küçük veri kümelerinde aşırı uyum sağlamaya daha yatkın olan benzersiz bir yaprak-bilge ağaç büyüme stratejisi kullanır.
  • CatBoost: Bu tür değişkenleri sofistike bir şekilde ele alması nedeniyle özellikle çok sayıda kategorik özellik içeren veri kümelerinde üstündür. Kategorik veriler için XGBoost'a kıyasla genellikle daha az hiperparametre ayarı gerektirir.
  • Derin Öğrenme (DL) Modelleri: Evrişimsel Sinir Ağları (CNN'ler) gibi algoritmalar veya Ultralytics YOLO öncelikle görüntü veya metin gibi yapılandırılmamış veriler için tasarlanmıştır ve bilgisayarla görme (CV)(nesne algılama, görüntü segmentasyonu) gibi görevlerde mükemmeldir. XGBoost ise iş analitiğinde yaygın olarak bulunan yapılandırılmış, tablo halindeki veri kümeleri için tipik olarak daha üstündür.

Gerçek Dünya Uygulamaları

XGBoost'un performansı ve sağlamlığı, onu çok çeşitli tahmine dayalı modelleme uygulamaları için uygun hale getirir:

  • Finansal Hizmetler: Kredi riski değerlendirmesi, dolandırıcılık tespiti ve algoritmik ticaret stratejileri için yaygın olarak kullanılır. Örneğin bankalar, müşteri başvuru verilerine dayanarak kredi temerrüdü olasılığını tahmin eden modeller oluşturmak için XGBoost'u kullanır. Finans alanında yapay zeka hakkında daha fazla bilgi edinin.
  • Perakende ve E-ticaret: Müşteri davranış analizi, müşteri kaybı, satış tahmini ve öneri motorları oluşturma tahminlerinde uygulanır. Örneğin, çevrimiçi bir perakendeci, hangi müşterilerin belirli bir pazarlama kampanyasına yanıt verme olasılığının yüksek olduğunu tahmin etmek için XGBoost'u kullanabilir.
  • Sağlık Hizmetleri: Hasta sonuçlarını, klinik verilere dayalı hastalık riskini tahmin etmede ve hastane operasyonlarını optimize etmede kullanılır. Sağlık hizmetlerinde yapay zeka hakkında daha fazla bilgi edinin.
  • Üretim: Kestirimci bakım (ekipman arızasını tahmin etme), kalite kontrol analizi ve üretim süreçlerini optimize etmek için kullanılır. Üretimde Yapay Zekayı Keşfedin.
  • Rekabetçi Veri Bilimi: XGBoost, yüksek doğruluğu ve verimliliği nedeniyle Kaggle 'da düzenlenenler gibi veri bilimi yarışmalarında favori bir algoritmadır.

XGBoost, hızı, doğruluğu ve karmaşık tablo veri kümelerini etkili bir şekilde işleme yeteneği ile tercih edilen makine öğrenimi ortamında oldukça alakalı ve güçlü bir araç olmaya devam etmektedir. XGBoost'un gelişimi resmi XGBoost kütüphanesi aracılığıyla devam etmektedir ve Scikit-learn gibi popüler makine öğrenimi kütüphaneleri ve Ultralytics HUB gibi platformlarla uçtan uca makine öğrenimi yaşam döngüsünü yönetmek için iyi bir şekilde entegre olmaktadır.

Tümünü okuyun