Sözlük

LightGBM

Makine öğrenimi uygulamalarında yüksek doğruluk sağlayan, büyük veri kümeleri için hızlı, verimli gradyan artırma çerçevesi LightGBM'yi keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Light Gradient Boosting Machine'in kısaltması olan LightGBM, Microsoft Research tarafından geliştirilen yüksek performanslı, açık kaynaklı bir gradyan artırma çerçevesidir. Özellikle büyük veri kümeleriyle (Büyük Veri) uğraşırken sınıflandırma, regresyon ve sıralama gibi görevler için Makine Öğreniminde (ML ) yaygın olarak kullanılır. LightGBM, hızı ve verimliliği ile ünlüdür ve diğer boosting algoritmalarına kıyasla daha az bellek tüketirken genellikle yüksek doğruluk elde eder. Karar ağacı algoritmalarında bulunan kavramlara dayanır ve güçlü bir tahmin modeli oluşturmak için iteratif olarak bir zayıf öğreniciler topluluğu oluşturan gradyan artırma yöntemleri ailesinin bir parçasıdır.

LightGBM Hız ve Verimliliği Nasıl Elde Ediyor?

LightGBM, performansı optimize etmek ve büyük ölçekli verileri etkili bir şekilde işlemek için çeşitli yenilikçi teknikler kullanır:

  • Gradyan Tabanlı Tek Taraflı Örnekleme (GOSS): Bu yöntem, daha büyük gradyanlara sahip veri örneklerine (şu anda kötü tahmin edilenler) odaklanırken, küçük gradyanlara sahip örnekleri rastgele bırakır. Bu, her bir ağacı eğitmek için gereken veri miktarını önemli ölçüde azaltırken doğruluğu korur.
  • Ayrıcalıklı Özellik Paketlemesi (EFB): Bu teknik, birbirini dışlayan özellikleri (nadiren aynı anda sıfırdan farklı değerler alan özellikler) bir araya getirerek önemli bilgi kaybı olmadan özellik sayısını etkili bir şekilde azaltır(boyut azaltma). Bu, en iyi ayırma noktalarını bulma karmaşıklığını azaltarak eğitimi hızlandırır.
  • Yaprak Bazında Ağaç Büyümesi: Ağaçları katman katman genişleten geleneksel seviye bazlı büyümenin aksine, LightGBM ağaçları yaprak yaprak büyütür. Bölmek için maksimum kayıp azaltımına sahip yaprağı seçer, bu da daha hızlı yakınsamaya ve potansiyel olarak daha karmaşık ağaçlara yol açar, ancak bazen uygun şekilde kısıtlanmadığında aşırı uyuma yol açabilir. Yaprak bazında büyüme hakkında daha fazla bilgiyi resmi belgelerden edinebilirsiniz.

Bu optimizasyonlar, histogram tabanlı algoritmalar gibi tekniklerden yararlanan verimli uygulamalarla birleştiğinde, LightGBM'yi olağanüstü hızlı ve bellek açısından verimli hale getirerek, standart optimizasyon algoritmalarını kullanan diğer çerçeveler için engelleyici olabilecek büyük veri kümeleri üzerinde eğitime olanak tanır.

LightGBM'nin Temel Özellikleri

LightGBM, ML uygulayıcıları için çeşitli avantajlar sunar:

  • Hız ve Verimlilik: Diğer birçok güçlendirme çerçevesine kıyasla önemli ölçüde daha yüksek eğitim hızı ve daha düşük bellek kullanımı.
  • Yüksek Doğruluk: Genellikle tablo halindeki veri görevlerinde son teknoloji ürünü sonuçlar sunar.
  • GPU Desteği: Daha fazla hızlandırma için GPU 'larda eğitimi destekler.
  • Paralel ve Dağıtılmış Eğitim: Birden fazla makinede dağıtılmış eğitim yoluyla son derece büyük veri kümelerini işleyebilir.
  • Kategorik Özellik İşleme: Kategorik özellikleri doğrudan işleyebilir ve genellikle tek vuruşlu kodlama gibi kapsamlı özellik mühendisliği ihtiyacını ortadan kaldırır.
  • Düzenli hale getirme: Aşırı uyumu önlemek için düzenli hale getirme parametrelerini (L1 ve L2 gibi) içerir.
  • Büyük Ölçekli Veri İşleme: Belleğe sığmayabilecek çok büyük veri kümeleriyle verimli bir şekilde çalışmak için tasarlanmıştır.
  • Hiperparametre Ayarlama: Belirli görevler için performansı optimize etmek üzere hiperparametre ayarlama yoluyla ayarlanabilen çeşitli parametreler sunar.

Ayrıntılı kullanım ve gelişmiş özellikler için resmi LightGBM belgelerine ve GitHub deposuna başvurun. Optimum sonuçlar için uygun veri ön işleme önemlidir.

Diğer Güçlendirme Çerçeveleri ile Karşılaştırma

LightGBM genellikle XGBoost ve CatBoost gibi diğer popüler gradyan artırma kütüphaneleriyle karşılaştırılır. Temel farklılıklar şunlardır:

  • Hız: LightGBM, GOSS ve EFB teknikleri sayesinde özellikle büyük veri kümelerinde XGBoost'tan daha hızlı kabul edilir. CatBoost'un hızı, özellikle kategorik özelliklerde rekabetçi olabilir.
  • Bellek Kullanımı: LightGBM genellikle XGBoost'tan daha az bellek kullanır.
  • Kategorik Özellikler: CatBoost, kategorik özellikler için gelişmiş yerleşik işleme sahiptir ve çok sayıda kategorik değişken içeren veri kümelerinde genellikle LightGBM ve XGBoost'tan (tek vuruşlu kodlama gibi ön işleme gerektiren) daha iyi performans gösterir. LightGBM doğrudan işleme sunar ancak CatBoost'un yaklaşımından daha az sağlam olabilir.
  • Ağaç Büyümesi: LightGBM yaprak bazında büyümeyi kullanırken, XGBoost ve CatBoost genellikle seviye bazında büyümeyi kullanır (XGBoost ayrıca yaprak bazında bir seçenek de sunar).
  • Hiperparametreler: Her kütüphanenin ayarlama gerektiren kendi hiperparametre seti vardır. CatBoost genellikle iyi sonuçlar için daha az ayarlama gerektirir.

Bunlar arasındaki seçim genellikle belirli veri kümesi özelliklerine (boyut, özellik türleri) ve proje gereksinimlerine bağlıdır. Bu karşılaştırma makalesi gibi kaynaklar daha fazla bilgi sunmaktadır.

Gerçek Dünya Uygulamaları

LightGBM'nin güçlü yönleri, onu yapılandırılmış veya tablo halindeki verileri içeren çeşitli uygulamalar için uygun hale getirir:

  1. Dolandırıcılık Tespiti: Finans sektöründe(finansta yapay zeka), LightGBM milyonlarca işlem kaydını hızlı bir şekilde işleyerek(tahmine dayalı modelleme) neredeyse gerçek zamanlı olarak hileli faaliyetlerin göstergesi olan ince kalıpları belirleyebilir. Hızı, zamanında müdahale için çok önemlidir. Dolandırıcılık tespit sistemleri onun verimliliğinden büyük ölçüde faydalanır.
  2. Kestirimci Bakım: Üreticiler(üretimde yapay zeka) makinelerden gelen sensör verilerini analiz etmek için LightGBM kullanır. Model, ekipman performansı ve arızalarına ilişkin geçmiş veriler üzerinde eğitim alarak olası arızaları meydana gelmeden önce tahmin edebilir, proaktif bakım sağlayabilir ve arıza süresini azaltabilir. Kestirimci bakım kavramları hakkında daha fazla bilgi edinin.

Diğer yaygın uygulamalar arasında müşteri kaybı tahmini, öneri sistemleri, tıklama oranı tahmini, kredi puanlaması ve talep tahmini yer almaktadır. Performansı, onu Kaggle'da düzenlenenler gibi veri bilimi yarışmalarında popüler bir seçim haline getirmiştir.

LightGBM, klasik makine öğrenimi görevleri için tablo verileriyle üstünlük sağlarken, aşağıdaki gibi modellerden farklıdır Ultralytics YOLO. YOLO modelleri, yapılandırılmamış görüntü veya video verilerinde nesne algılama, görüntü sınıflandırma ve görüntü segmentasyonu gibi bilgisayarla görme (CV) görevleri için tasarlanmış özel derin öğrenme (DL) mimarileridir. Ultralytics HUB gibi platformlar, bu tür CV modellerinin geliştirilmesini ve dağıtılmasını kolaylaştırır. LightGBM, büyük veri kümelerinde hız ve verimliliğin çok önemli olduğu yapılandırılmış veri sorunları için hayati bir araç olmaya devam etmektedir. Daha fazla teknik ayrıntı için orijinal LightGBM araştırma makalesini inceleyebilirsiniz.

Tümünü okuyun