مسرد المصطلحات

شجرة القرار

اكتشف قوة أشجار القرار في التعلم الآلي للتصنيف والانحدار والتطبيقات الواقعية مثل الرعاية الصحية والتمويل.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

شجرة القرار هي خوارزمية متعددة الاستخدامات ومستخدمة على نطاق واسع للتعلم الآلي (ML) تندرج تحت فئة التعلم تحت الإشراف. وهي تستخدم بنية شبيهة بالشجرة لنمذجة القرارات وعواقبها المحتملة، على غرار المخطط الانسيابي. تمثل كل عقدة داخلية اختبارًا على سمة (أو ميزة)، ويمثل كل فرع نتيجة الاختبار، وتمثل كل عقدة ورقية تسمية فئة (في مهام التصنيف) أو قيمة مستمرة (في مهام الانحدار). نظرًا لبنيتها البديهية، تُعرف أشجار القرار بكونها سهلة الفهم والتفسير نسبيًا، مما يجعلها ذات قيمة للذكاء الاصطناعي القابل للتفسير (XAI).

كيفية عمل أشجار القرار

تتمثّل الفكرة الأساسية في تقسيم مجموعة البيانات إلى مجموعات فرعية أصغر فأصغر بناءً على قيم ميزات الإدخال، مما يؤدي إلى إنشاء بنية شجرية. تبدأ العملية من العقدة الجذرية التي تمثل مجموعة البيانات بأكملها. في كل عقدة، تختار الخوارزمية أفضل ميزة وعتبة لتقسيم البيانات بطريقة تزيد من نقاء أو تجانس المجموعات الفرعية الناتجة فيما يتعلق بالمتغير المستهدف. تشمل المعايير الشائعة للعثور على أفضل تقسيم شوائب جيني وكسب المعلومات (استنادًا إلى الإنتروبيا)، والتي تقيس الاضطراب أو العشوائية في المجموعة. وتستمر عملية التقسيم هذه بشكل متكرر حتى يتم استيفاء معيار التوقف، مثل الوصول إلى الحد الأقصى للعمق أو وجود حد أدنى لعدد العينات في عقدة ما أو تحقيق عقدة ورقة نقية (عقد تحتوي على عينات من فئة واحدة فقط). ولإجراء تنبؤ لنقطة بيانات جديدة، فإنه يجتاز الشجرة من الجذر نزولاً إلى عقدة ورقة بناءً على نتائج اختبارات السمات، ويكون التنبؤ هو الفئة الأكثرية أو القيمة المتوسطة في تلك الورقة. يمكن أن تؤثر المعالجة المسبقة الدقيقة للبيانات وهندسة السمات بشكل كبير على أداء شجرة القرار.

أنواع أشجار القرار

يمكن تصنيف أشجار القرار بشكل عام إلى نوعين رئيسيين:

  • أشجار التصنيف: تُستخدم عندما يكون المتغير المستهدف فئويًا (على سبيل المثال، التنبؤ ب "بريد مزعج" أو "ليس بريدًا مزعجًا"). تمثل العقد الورقية تسميات الفئات.
  • أشجار الانحدار: تُستخدم عندما يكون المتغير المستهدف مستمرًا (على سبيل المثال، التنبؤ بأسعار المنازل). تمثل عقد الأوراق قيمة عددية متوقعة، وغالبًا ما تكون متوسط القيم المستهدفة لعينات التدريب التي تصل إلى تلك الورقة.

المزايا والعيوب

تقدم أشجار القرار العديد من الفوائد:

  • قابلية التفسير: هيكلها البياني يجعلها سهلة التصور والفهم.
  • الحد الأدنى من إعداد البيانات: غالبًا ما تتطلب تنظيفًا أقل للبيانات مقارنةً بالخوارزميات الأخرى، مثل الحاجة إلى قدر أقل من تطبيع البيانات.
  • يعالج البيانات غير الخطية: يمكنها التقاط العلاقات غير الخطية بين السمات والمتغير الهدف.
  • أهمية الميزة: إنها توفر بطبيعتها مقياسًا لأهمية الميزة بناءً على مدى استخدام الميزة في وقت مبكر أو في كثير من الأحيان للتقسيم.

ومع ذلك، فإن لها أيضًا عيوبًا:

  • الإفراط في التعميم: يمكن بسهولة أن تصبح أشجار القرار معقدة للغاية وتلتقط الضوضاء في بيانات التدريب، مما يؤدي إلى تعميم ضعيف على بيانات الاختبار غير المرئية. تساعد تقنيات مثل التقليم أو وضع قيود على نمو الشجرة في الحد من الإفراط في التعميم.
  • عدم الاستقرار: يمكن أن تؤدي الاختلافات الصغيرة في البيانات إلى إنشاء شجرة مختلفة تمامًا.
  • التحيز: يمكن أن تنحاز الأشجار نحو الميزات ذات المستويات الأكثر أو الفئات السائدة إذا كانت مجموعة البيانات غير متوازنة.

التطبيقات الواقعية

تُستخدم أشجار القرار في مجالات مختلفة:

  1. التشخيص الطبي: مساعدة الأطباء من خلال إنشاء نماذج تقترح التشخيص بناءً على أعراض المريض ونتائج الاختبارات. على سبيل المثال، يمكن للشجرة توجيه التشخيص عن طريق طرح أسئلة حول الأعراض بالتتابع(الذكاء الاصطناعي في تطبيقات الرعاية الصحية).
  2. التنبؤ باضطراب العملاء: تستخدم الشركات أشجار القرار لتحديد العملاء الذين من المحتمل أن يتوقفوا عن استخدام خدمتهم بناءً على أنماط الاستخدام والتركيبة السكانية وتاريخ التفاعل، مما يسمح بجهود الاحتفاظ المستهدفة(التنبؤ بتراجع العملاء).
  3. تقييم المخاطر المالية: تقييم الجدارة الائتمانية من خلال تحليل عوامل مثل الدخل والديون والتاريخ الائتماني(نماذج الرؤية الحاسوبية في التمويل).
  4. مراقبة جودة التصنيع: تحديد العيوب المحتملة في المنتجات بناءً على قراءات أجهزة الاستشعار أو معلمات العملية(تحسين التصنيع باستخدام الرؤية الحاسوبية).

العلاقة بالنماذج الأخرى

تُشكّل أشجار القرار أساسًا لطرق تجميعية أكثر تعقيدًا مثل الغابات العشوائية والأشجار المعززة بالتدرج (مثل XGBoost أو LightGBM). على سبيل المثال، تقوم الغابات العشوائية ببناء أشجار قرار متعددة على مجموعات فرعية مختلفة من البيانات والميزات وتجميع تنبؤاتها، مما يؤدي في كثير من الأحيان إلى دقة وقوة أفضل ضد الإفراط في التكييف مقارنةً بشجرة واحدة. على الرغم من قوتها في العديد من مشاكل البيانات المجدولة، إلا أن أشجار القرار تختلف بشكل كبير عن نماذج مثل الشبكات العصبية التلافيفية (CNNs) أو محولات الرؤية (ViT) المستخدمة في الرؤية الحاسوبية. نماذج مثل Ultralytics YOLO11 تستفيد من بنيات التعلم العميق المحسّنة لمهام مثل اكتشاف الأجسام وتصنيف الصور وتجزئة النماذج، والتي تتضمن معالجة بيانات معقدة وعالية الأبعاد مثل الصور، وهو مجال تكون فيه أشجار القرار الفردي أقل فعالية. ويوفر فهم النماذج التأسيسية مثل أشجار القرار سياقًا قيّمًا ضمن المشهد الأوسع للذكاء الاصطناعي والنمذجة التنبؤية. وتوفر أدوات مثل Scikit-learn تطبيقات شائعة لأشجار القرار، بينما تعمل منصات مثل Ultralytics HUB على تبسيط تطوير ونشر نماذج الرؤية المتقدمة.

قراءة الكل