Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

LightGBM

اكتشف LightGBM، وهو إطار عمل سريع وفعال لتعزيز التدرج لمجموعات البيانات الكبيرة، مما يوفر دقة عالية في تطبيقات تعلم الآلة.

LightGBM (Light Gradient Boosting Machine) هو إطار عمل مفتوح المصدر عالي الأداء لتعزيز التدرج، وهو مصمم خصيصًا ليكون سريعًا وفعالًا من حيث استخدام الذاكرة. تم تطويره بواسطة Microsoft وأصبح أداة لا غنى عنها لعلماء البيانات الذين يعملون مع مجموعات بيانات منظمة واسعة النطاق. على عكس الخوارزميات التقليدية التي قد تواجه صعوبات في التعامل مع كميات ضخمة من البيانات، تم تحسين LightGBM للتعامل مع بيئات البيانات الضخمة بسلاسة، مما يوفر سرعات تدريب أسرع واستهلاك أقل للذاكرة دون التضحية بالقدرة التنبؤية. يستخدم على نطاق واسع في الترتيب والتصنيف ومهام التعلم الآلي (ML) الأخرى حيث الكفاءة أمر بالغ الأهمية.

الآليات الأساسية والكفاءة

تنبع كفاءة LightGBM من نهجها الفريد في بناء أشجار القرار. في حين أن معظم خوارزميات التعزيز تنمي الأشجار مستوى تلو الآخر (عمقًا)، تستخدم LightGBM استراتيجية نمو على شكل أوراق. تحدد هذه الطريقة الورقة التي تحقق أعلى انخفاض في الخسارة وتقسمها، مما يسمح للنموذج بالتقارب بشكل أسرع. غالبًا ما ينتج عن هذا النهج المستهدف دقة أفضل مقارنة بالخوارزميات المستوية .

لتحسين الأداء بشكل أكبر، يقدم LightGBM تقنيتين رئيسيتين:

  • أخذ العينات من جانب واحد على أساس التدرج (GOSS): تحتفظ هذه التقنية بحالات البيانات ذات التدرجات الكبيرة (الأخطاء الكبيرة) بينما تأخذ عينات عشوائية من تلك ذات التدرجات الصغيرة. من خلال تركيز خوارزمية التحسين على الحالات الأصعب في التنبؤ، يتعلم النموذج بشكل أكثر فعالية مع معالجة أقل للبيانات.
  • تجميع الميزات الحصرية (EFB): في مجموعات البيانات عالية الأبعاد، تتعارض العديد من الميزات مع بعضها البعض (نادرًا ما تكون غير صفرية في نفس الوقت). يقوم EFB بتجميع هذه الميزات معًا لتقليل الأبعاد، مما يؤدي إلى تسريع تدريب النموذج بشكل كبير.

تطبيقات واقعية

يتميز LightGBM بقدرته الفائقة على معالجة البيانات الجدولية ، وهو مكون أساسي في العديد من أنظمة الذكاء الاصطناعي الصناعية.

  1. تقييم المخاطر المالية: تستخدم البنوك وشركات التكنولوجيا المالية LightGBM في النمذجة التنبؤية لتقييم طلبات القروض . من خلال تحليل السجل الائتماني وأنماط المعاملات، يساعد النموذج المؤسسات على توقع احتمالية التخلف عن السداد، مما يتيح اتخاذ قرارات إقراض أكثر ذكاءً ووضع استراتيجيات ذكاء اصطناعي قوية في مجال التمويل.
  2. التشخيصات الطبية: في المجال الطبي، يستخدم الأطباء LightGBM لتحليل سجلات المرضى وعلاماتهم الحيوية. على سبيل المثال، يمكن أن يساعد في التنبؤ بظهور المرض أو معدلات إعادة إدخال المرضى إلى المستشفى، مما يجعله أداة حيوية للذكاء الاصطناعي في مجال الرعاية الصحية لدعم اتخاذ القرارات السريرية.

التمييز بين LightGBM والنماذج الأخرى

لاختيار الأداة المناسبة، من المفيد مقارنة LightGBM بأطر العمل الشائعة الأخرى في مجال التعلم الآلي .

  • LightGBM مقابل XGBoost: كلاهما مكتبتان قويتان لتعزيز التدرج. ومع ذلك، يستخدم XGBoost تقليديًا استراتيجية نمو على مستوى المستوى، والتي غالبًا ما تكون أكثر استقرارًا ولكنها أبطأ. نهج LightGBM على مستوى الأوراق أسرع بشكل عام وأكثر كفاءة في استخدام الذاكرة، على الرغم من أنه قد يتطلب ضبطًا دقيقًا للمعلمات الفائقة لمنع الإفراط في التكيف على مجموعات البيانات الصغيرة.
  • LightGBM مقابل Ultralytics YOLO: LightGBM هو المعيار للبيانات المنظمة (الجدولية)، بينما Ultralytics هو إطار عمل للتعلم العميق (DL) مصمم للبيانات غير المنظمة مثل الصور والفيديو. بينما يمكن لـ LightGBM توقع اتجاهات المبيعات، تتعامل YOLO مع مهام مثل اكتشاف الكائنات و تصنيف الصور. غالبًا ما يجمع المطورون بين هذه الأدوات على Ultralytics لإنشاء حلول شاملة للذكاء الاصطناعي تستفيد من البيانات المرئية والرقمية.

مثال على الرمز

يوضّح مقتطف Python التالي كيفية تدريب مصنف LightGBM أساسي على بيانات اصطناعية.

import lightgbm as lgb
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split

# Generate synthetic binary classification data
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# Initialize and train the LightGBM model
model = lgb.LGBMClassifier(learning_rate=0.05, n_estimators=100)
model.fit(X_train, y_train)

# Display the accuracy score
print(f"Test Accuracy: {model.score(X_test, y_test):.4f}")

للتعمق أكثر في المعلمات المحددة وتعليمات التثبيت، يمكنك زيارة الوثائق الرسمية لـ LightGBM. غالبًا ما يتضمن دمج هذه النماذج في خطوط إنتاج أكبر خطوات مثل المعالجة المسبقة للبيانات و تقييم النموذج لضمان الموثوقية في بيئات الإنتاج.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن