اكتشف XGBoost، خوارزمية التعلم الآلي القوية والسريعة والمتعددة الاستخدامات للتنبؤات الدقيقة في مهام التصنيف والانحدار.
XGBoost، أو Extreme Gradient Boosting، هي مكتبة برمجيات موزعة ومُحسّنة للغاية مصممة لتنفيذ إطار عمل تعزيز التدرج بكفاءة ورشاقة استثنائيتين. وقد أثبتت نفسها كخوارزمية أساسية في مجال التعلم الآلي (ML)، وتشتهر بشكل خاص بأدائها المتميز في مجموعات البيانات المنظمة أو الجدولية. تم تطويرها في الأصل كمشروع بحثي في جامعة واشنطن، اكتسب XGBoost شعبية هائلة من خلال مساعدة علماء البيانات على الفوز بالعديد من مسابقات Kaggle وأصبح منذ ذلك الحين معيارًا صناعيًا للمهام التنبؤية التي تتراوح من الانحدار إلى التصنيف. من خلال الجمع بين تنبؤات العديد من المتعلمين "الضعفاء" —عادةً ما تكون أشجار قرارسطحية—في متعلم "قوي" واحد، فإنه يحقق نتائج متطورة مع تقليل تكاليف الحوسبة.
تعمل الخوارزمية على مبدأ التعلم الجماعي، وتحديداً التعزيز. على عكس طرق التجميع مثل Random Forest، التي تبني الأشجار بشكل مستقل وبالتوازي، فإن XGBoost تبني الأشجار بشكل متسلسل. تضاف كل شجرة جديدة لتصحيح الأخطاء المتبقية التي ارتكبتها المجموعة الحالية، مما يؤدي إلى التعلم الفعال من الأخطاء السابقة لتحسين الدقة الإجمالية .
يتميز XGBoost بعدة تطورات هندسية رئيسية:
نظرًا لقابليته للتوسع وسرعته، يتم استخدام XGBoost في بيئات الإنتاج الحيوية في مختلف القطاعات.
إن فهم متى يجب استخدام XGBoost مقابل الخوارزميات الأخرى أمر بالغ الأهمية لنجاح تطوير الذكاء الاصطناعي.
يوضح المثال التالي كيفية تدريب مصنف XGBoost باستخدام Python . يتوافق سير العمل هذا مع أدوات علم البيانات القياسية مثل Scikit-learn.
import xgboost as xgb
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
# Load a standard dataset and split it
data = load_iris()
X_train, X_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.2)
# Initialize and train the XGBoost classifier
model = xgb.XGBClassifier(n_estimators=10, max_depth=3, learning_rate=0.1)
model.fit(X_train, y_train)
# Make predictions on the test set
print(f"Predictions: {model.predict(X_test)[:5]}")
بالنسبة للمطورين الذين يبنون أنظمة ذكاء اصطناعي شاملة، غالبًا ما يتعامل XGBoost مع مكونات البيانات المنظمة، بينما تتعامل النماذج التي تدار عبر Ultralytics مع مهام الإدراك البصري المعقدة . يمكن العثور على مزيد من التفاصيل حول الأسس الرياضية للخوارزمية في ورقة البحث الأصلية لـ XGBoost.