Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

CatBoost

اكتشف CatBoost، وهو خوارزمية قوية لتعزيز التدرج للبيانات الفئوية. تعرف على كيفية تحسينه للنمذجة التنبؤية جنبًا إلى جنب مع Ultralytics لعمليات سير عمل الذكاء الاصطناعي.

CatBoost (Categorical Boosting) هو خوارزمية تعلم آلي مفتوحة المصدر تعتمد على تعزيز التدرج في أشجار القرار. تم تطويره بواسطة Yandex، وهو مصمم لتقديم أداء عالٍ مع الحد الأدنى من إعداد البيانات، ويتميز بشكل خاص في التعامل مع البيانات الفئوية — المتغيرات التي تمثل مجموعات أو تسميات متميزة بدلاً من القيم الرقمية. بينما تتطلب الخوارزميات التقليدية غالبًا تقنيات معالجة مسبقة معقدة مثل الترميز أحادي الترميز لتحويل الفئات إلى أرقام، يمكن لـ CatBoost معالجة هذه الميزات مباشرة أثناء التدريب. هذه القدرة، جنبًا إلى جنب مع قدرتها على تقليل الإفراط في الملاءمة من خلال التعزيز المرتب، تجعلها خيارًا قويًا لمجموعة واسعة من مهام النمذجة التنبؤية في علم البيانات.

المزايا الأساسية والآلية

يتميز CatBoost عن طرق التجميع الأخرى من خلال عدة خيارات معمارية تعطي الأولوية للدقة وسهولة الاستخدام.

  • الدعم الفئوي الأصلي: تستخدم الخوارزمية تقنية تسمى إحصائيات الهدف المرتبة لتحويل القيم الفئوية إلى أرقام أثناء التدريب. وهذا يمنع تسرب الهدف الذي غالبًا ما يحدث مع طرق الترميز القياسية، مما يحافظ على سلامة عملية التحقق من الصحة.
  • التعزيز المرتب: يمكن أن تعاني طرق التعزيز التدرجي القياسية من تحول التنبؤ، وهو نوع من التحيز في الذكاء الاصطناعي. يعالج CatBoost هذه المشكلة باستخدام نهج قائم على التباديل لتدريب النموذج، مما يضمن عدم ملاءمة النموذج بشكل مفرط لتوزيع بيانات التدريب المحددة .
  • الأشجار المتماثلة: على عكس العديد من مكتبات التعزيز الأخرى التي تنمو الأشجار من حيث العمق أو الأوراق، يبني CatBoost أشجارًا متماثلة (متوازنة). تتيح هذه البنية سرعات استدلال فائقة السرعة، وهو أمر بالغ الأهمية لتطبيقات الاستدلال في الوقت الفعلي.

CatBoost مقابل XGBoost و LightGBM

يتم تقييم CatBoost بشكل متكرر جنبًا إلى جنب مع مكتبات التعزيز الشائعة الأخرى. على الرغم من أنها تشترك في نفس الإطار الأساسي، إلا أنها تتميز بخصائص مميزة.

  • XGBoost: مكتبة مرنة للغاية ومستخدمة على نطاق واسع ومعروفة بأدائها في مسابقات علوم البيانات. تتطلب عادةً ضبطًا دقيقًا للمعلمات الفائقة وترميزًا يدويًا للمتغيرات الفئوية للوصول إلى أعلى مستوى من الأداء.
  • LightGBM: تستخدم هذه المكتبة استراتيجية نمو على أساس الأوراق، مما يجعلها سريعة للغاية في التدريب على مجموعات البيانات الضخمة. ومع ذلك، بدون تنظيم دقيق، يمكن أن تكون عرضة للتكيف المفرط على مجموعات البيانات الأصغر مقارنة بأشجار CatBoost المتماثلة المستقرة.
  • CatBoost: غالبًا ما يوفر أفضل دقة "جاهزة للاستخدام" مع المعلمات الافتراضية. وهو الخيار المفضل عمومًا عندما تحتوي مجموعات البيانات على عدد كبير من السمات الفئوية، مما يقلل من الحاجة إلى هندسة سمات مكثفة.

تطبيقات واقعية

تجعل قوة CatBoost منه أداة متعددة الاستخدامات في مختلف الصناعات التي تتعامل مع البيانات المنظمة.

  1. تقييم المخاطر المالية: تستخدم البنوك وشركات التكنولوجيا المالية CatBoost لتقييم أهلية الحصول على القروض وتوقع حالات التخلف عن سداد الائتمان. يمكن للنموذج دمج أنواع مختلفة من البيانات بسلاسة، مثل مهنة مقدم الطلب (فئوية) ومستوى دخله (رقمي)، لإنشاء ملفات تعريف مخاطر دقيقة. هذه القدرة هي حجر الزاوية في الذكاء الاصطناعي الحديث في مجال التمويل.
  2. توصيات التجارة الإلكترونية: يستفيد تجار التجزئة عبر الإنترنت من CatBoost لتشغيل أنظمة التوصيات المخصصة. من خلال تحليل سجلات سلوك المستخدم وفئات المنتجات وسجل الشراء، يتنبأ الخوارزمية باحتمالية قيام المستخدم بالنقر على منتج ما أو شرائه، مما يساهم بشكل مباشر في تحسين الذكاء الاصطناعي في مجال البيع بالتجزئة.

التكامل مع الرؤية الحاسوبية

على الرغم من أن CatBoost هو أداة مخصصة في المقام الأول للبيانات الجدولية، إلا أنه يلعب دورًا حيويًا في سير عمل النماذج متعددة الوسائط حيث تلتقي البيانات المرئية بالبيانات الوصفية المنظمة. يتضمن سير العمل الشائع استخدام نموذج الرؤية الحاسوبية لاستخراج الميزات من الصور ثم إدخال تلك الميزات في مصنف CatBoost.

على سبيل المثال، قد يستخدم نظام تقييم العقارات Ultralytics لإجراء الكشف عن الكائنات في صور العقارات، وحساب المرافق مثل حمامات السباحة أو الألواح الشمسية. ثم يتم تمرير عدد هذه الكائنات كسمات رقمية إلى نموذج CatBoost جنبًا إلى جنب مع بيانات الموقع والمساحة للتنبؤ بقيمة المنزل. يمكن للمطورين إدارة مكون الرؤية في هذه الأنابيب باستخدام Ultralytics التي تبسط إدارة مجموعات البيانات ونشر النماذج.

يوضح المثال التالي كيفية تحميل YOLO المدرب مسبقًا لاستخراج عدد الكائنات من صورة، والتي يمكن أن تكون بمثابة ميزات إدخال لنموذج CatBoost.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("path/to/property_image.jpg")

# Extract class counts (e.g., counting 'cars' or 'pools')
# This dictionary can be converted to a feature vector for CatBoost
class_counts = {}
for result in results:
    for cls in result.boxes.cls:
        class_name = model.names[int(cls)]
        class_counts[class_name] = class_counts.get(class_name, 0) + 1

print(f"Features for CatBoost: {class_counts}")

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن