LightGBM
Büyük veri kümeleri için hızlı, verimli gradyan yükseltme çerçevesi olan ve makine öğrenimi uygulamalarında yüksek doğruluk sağlayan LightGBM'yi keşfedin.
LightGBM veya Light Gradient Boosting Machine, yüksek performanslı, açık kaynaklı bir
Microsoft tarafından geliştirilen gradyan artırma çerçevesi
sıralama, sınıflandırma ve diğer işlemler için yaygın olarak kullanılmaktadır.
makine öğrenimi (ML) görevleri. Özellikle
Büyük ölçekli verileri yüksek verimlilik ve düşük bellek kullanımı ile işlemek için tasarlanmıştır. Diğer birçok algoritmanın aksine
Büyük veri kümeleriyle mücadele eden LightGBM hız için optimize edilmiştir, bu da onu aşağıdakilerle çalışmak için tercih edilen bir seçim haline getirir
Hem endüstriyel uygulamalarda hem de rekabette büyük veri
veri bilimi ortamları. Ağaç tabanlı öğrenme algoritmalarını kullanarak, tahminleri yinelemeli olarak iyileştirir.
Son teknoloji ürünü sonuçlar.
Temel Mekanizmalar ve Verimlilik
LightGBM'nin birincil avantajı, aşağıdaki yapıların oluşturulmasına yönelik benzersiz yaklaşımında yatmaktadır
karar ağaçları. Geleneksel boosting algoritmaları
tipik olarak seviye bazlı (derinlik öncelikli) bir büyüme stratejisi kullanırken, LightGBM yaprak bazlı (en iyi öncelikli) bir strateji kullanır. Bu
yöntemi, büyümek için maksimum delta kaybına sahip yaprağı seçerek modelin çok daha hızlı yakınsamasını ve
daha yüksek doğruluk.
Hassasiyetten ödün vermeden performansı daha da artırmak için LightGBM iki yeni teknik içermektedir:
-
Gradyan Tabanlı Tek Taraflı Örnekleme (GOSS): Bu teknik, veri örneklerini aşağı örneklemektedir. Bu tutar
büyük gradyanlara (daha büyük hatalar) sahip tüm örnekler ve küçük gradyanlara sahip örnekler üzerinde rastgele örnekleme gerçekleştirir.
Bu yaklaşım, daha küçük gradyanlara sahip veri noktalarının zaten iyi eğitilmiş olduğunu varsayar ve
odaklanmak için optimizasyon algoritması
daha zor vakalar.
-
Ayrıcalıklı Özellik Paketlemesi (EFB): Yüksek boyutlu verilerde, birçok özellik birbirini dışlar
(aynı anda asla sıfırdan farklı değildirler). EFB, boyutluluğu azaltmak için bu özellikleri bir araya getirerek önemli ölçüde
model eğitimini hızlandırmak.
Gerçek Dünya Uygulamaları
LightGBM özellikle yapılandırılmış veya tablo halindeki veriler için etkilidir ve
çeşitli sektörlerdeki kritik sistemlere güç sağlar.
-
Finansal Dolandırıcılık Tespiti: Finans sektöründe hız kritik öneme sahiptir. LightGBM analiz etmek için kullanılır
Şüpheli faaliyetleri işaretlemek için milyonlarca işlem kaydını gerçek zamanlı olarak izler. ile entegre ederek
Finans alanında yapay zeka
iş akışları sayesinde kurumlar yanlış pozitifleri azaltabilir ve dolandırıcılığı daha gerçekleşmeden önleyebilir.
-
Sağlık Hizmetlerinde Teşhis: Tıp uzmanları LightGBM'yi aşağıdakiler için kullanır
Hasta risklerini değerlendirmek için öngörücü modelleme.
Örneğin, diyabet gibi hastalıkların olasılığını tahmin etmek için hasta geçmişini ve yaşamsal belirtileri analiz edebilir
veya kalp rahatsızlıkları, modern yaşamın hayati bir bileşeni olarak
Sağlık hizmetlerinde yapay zeka.
Diğer Modellerle Karşılaştırma
LightGBM'nin makine öğrenimi ortamında nereye oturduğunu anlamak, onu benzer güçlendirme kütüphanelerinden ve
derin öğrenme çerçeveleri.
-
LightGBM vs. XGBoost ve CatBoost: Bir yandan
XGBoost ve
CatBoost da popüler gradyan artırma kütüphaneleridir,
uygulama açısından farklılık gösterirler. XGBoost geleneksel olarak daha istikrarlı ancak genellikle daha yavaş olan seviye bazlı büyümeyi kullanır
LightGBM'nin yaprak-bilge yaklaşımına göre. CatBoost özellikle kategorik veriler için optimize edilmişken, LightGBM genellikle
gibi ön işlemler gerektirir
kategorileri işlemek için özellik mühendisliği
en iyi şekilde.
-
LightGBM vs. Ultralytics YOLO: LightGBM yapılandırılmış veri görevlerinde (satırlar ve sütunlar) üstündür. İçinde
zıtlık, Ultralytics YOLO11 bir
için tasarlanmış derin öğrenme (DL) çerçevesi
görüntüler ve videolar gibi yapılandırılmamış veriler. LightGBM müşteri kaybını tahmin edebilirken, YOLO modelleri
nesne algılama ve
görüntü sınıflandırması. Kapsamlı yapay zeka için
çözümlerinde, geliştiriciler genellikle vizyonu yönetmek için Ultralytics Platformunu kullanır
LightGBM gibi tablo modellerinin yanı sıra modeller.
Kod Örneği
Aşağıdaki Python kod parçacığı, sentetik veriler üzerinde temel bir LightGBM sınıflandırıcısının nasıl eğitileceğini göstermektedir.
import lightgbm as lgb
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
# Generate synthetic binary classification data
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# Initialize and train the LightGBM model
model = lgb.LGBMClassifier(learning_rate=0.05, n_estimators=100)
model.fit(X_train, y_train)
# Display the accuracy score
print(f"Test Accuracy: {model.score(X_test, y_test):.4f}")
Temel algoritmalar hakkında daha fazla bilgi için
resmi LightGBM belgeleri.