Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

LightGBM

اكتشف LightGBM، وهو إطار عمل عالي الأداء لتعزيز التدرج للبيانات المنظمة. تعرف على كيفية توفيره لتدريب أسرع ودقة أعلى لمهام التعلم الآلي.

آلة تعزيز التدرج الخفيف، المعروفة باسم LightGBM، هي إطار عمل مفتوح المصدر وموزع لتعزيز التدرج تم تطويره بواسطة Microsoft ويستخدم خوارزميات التعلم القائمة على الأشجار . وقد تم تصميمه ليكون موزعًا وفعالًا مع المزايا التالية: سرعة تدريب أسرع و كفاءة أعلى، واستخدام أقل للذاكرة، ودقة أفضل، ودعم GPU المتوازي GPU ، والقدرة على معالجة البيانات على نطاق واسع. في المشهد الأوسع للتعلم الآلي (ML)، يعمل كأداة قوية للتصنيف والتصنيف والعديد من مهام التعلم الآلي الأخرى. يحظى LightGBM بشعبية خاصة في علوم البيانات التنافسية والتطبيقات الصناعية حيث السرعة والأداء على البيانات المنظمة أمر بالغ الأهمية.

كيف يعمل LightGBM

في جوهره، LightGBM هو أسلوب تجميع يجمع بين التنبؤات من عدة أشجار قرار لوضع تنبؤ نهائي. على عكس خوارزميات التعزيز التقليدية التي تنمي الأشجار على مستوى المستوى (أفقياً)، يستخدم LightGBM استراتيجية نمو على مستوى الأوراق (عمودياً). وهذا يعني أنه يختار الورقة ذات الحد الأقصى من خسارة دلتا للنمو. يمكن أن يقلل هذا النهج الخسارة بشكل أكبر من الخوارزمية على مستوى المستوى، مما يؤدي إلى دقة أعلى وتقارب أسرع.

للحفاظ على السرعة دون التضحية بالدقة، يستخدم LightGBM تقنيتين جديدتين: التجميع أحادي الجانب القائم على التدرج (GOSS) وتجميع الميزات الحصرية (EFB). يستبعد GOSS نسبة كبيرة من حالات البيانات ذات التدرجات الصغيرة، ويركز التدريب على الأمثلة الأصعب في التعلم. يجمع EFB الميزات المتبادلة الحصرية لتقليل عدد الميزات بشكل فعال. تسمح هذه التحسينات للإطار بمعالجة كميات هائلة من بيانات التدريب بسرعة مع الحفاظ على استهلاك منخفض للذاكرة .

التمييز بين LightGBM والنماذج الأخرى

لاختيار الأداة المناسبة، من المفيد مقارنة LightGBM بأطر العمل الشائعة الأخرى في مجال التعلم الآلي .

  • LightGBM مقابل XGBoost: كلاهما مكتبتان قويتان لتعزيز التدرج. ومع ذلك، يستخدم XGBoost تقليديًا استراتيجية نمو على مستوى المستوى، والتي غالبًا ما تكون أكثر استقرارًا ولكنها أبطأ. نهج LightGBM على مستوى الأوراق أسرع بشكل عام وأكثر كفاءة في استخدام الذاكرة، على الرغم من أنه قد يتطلب ضبطًا دقيقًا للمعلمات الفائقة لمنع الإفراط في الملاءمة على مجموعات البيانات الصغيرة.
  • LightGBM مقابل Ultralytics YOLO: LightGBM هو المعيار للبيانات المنظمة (الجدولية)، بينما Ultralytics هو إطار عمل للتعلم العميق (DL) مصمم للبيانات غير المنظمة مثل الصور والفيديو. بينما يمكن لـ LightGBM توقع اتجاهات المبيعات، تتعامل YOLO مع مهام مثل اكتشاف الكائنات و تصنيف الصور. غالبًا ما يجمع المطورون بين هذه الأدوات على Ultralytics لإنشاء حلول شاملة للذكاء الاصطناعي تستفيد من كل من البيانات المرئية والرقمية.

تطبيقات واقعية

LightGBM متعدد الاستخدامات ويستخدم في مختلف الصناعات لحل المشكلات التنبؤية المعقدة باستخدام البيانات المنظمة.

  1. تقييم المخاطر المالية: تستخدم البنوك وشركات التكنولوجيا المالية LightGBM من أجل تقييم الجدارة الائتمانية وكشف الاحتيال. من خلال تحليل سجل المعاملات وبيانات المستخدمين الديموغرافية وأنماط السلوك، يمكن للنموذج classify بدقة على أنها مشروعة أو احتيالية في الوقت الفعلي، مما يقلل بشكل كبير من الخسائر المالية.
  2. توقعات الطلب على التجزئة: يستخدم تجار التجزئة هذا الإطار لتوقع احتياجات المخزون. من خلال معالجة بيانات المبيعات التاريخية والموسمية ونفقات التسويق، يساعد LightGBM في تحسين سلاسل التوريد، مما يضمن توافر المنتجات عندما يحتاجها العملاء دون الإفراط في التخزين. وهذا يتماشى مع ممارسات التصنيع الذكية الحديثة.

مثال على الرمز

يوضح Python التالي Python كيفية تدريب مصنف LightGBM أساسي على بيانات اصطناعية. يفترض هذا أنك قد أجريت معالجة أولية أساسية للبيانات.

import lightgbm as lgb
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split

# Generate synthetic binary classification data
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# Initialize and train the LightGBM model
model = lgb.LGBMClassifier(learning_rate=0.05, n_estimators=100)
model.fit(X_train, y_train)

# Display the accuracy score
print(f"Test Accuracy: {model.score(X_test, y_test):.4f}")

للتعمق أكثر في المعلمات المحددة وتعليمات التثبيت، يمكنك زيارة الوثائق الرسمية لـ LightGBM. غالبًا ما يتضمن دمج هذه النماذج في خطوط إنتاج أكبر خطوات مثل تقييم النموذج لضمان الموثوقية في بيئات الإنتاج.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن