اكتشف قوة أشجار القرار في التعلم الآلي للتصنيف والانحدار والتطبيقات الواقعية مثل الرعاية الصحية والتمويل.
شجرة القرار هي خوارزمية متعددة الاستخدامات ومستخدمة على نطاق واسع للتعلم الآلي (ML) تندرج تحت فئة التعلم تحت الإشراف. وهي تستخدم بنية شبيهة بالشجرة لنمذجة القرارات وعواقبها المحتملة، على غرار المخطط الانسيابي. تمثل كل عقدة داخلية اختبارًا على سمة (أو ميزة)، ويمثل كل فرع نتيجة الاختبار، وتمثل كل عقدة ورقية تسمية فئة (في مهام التصنيف) أو قيمة مستمرة (في مهام الانحدار). نظرًا لبنيتها البديهية، تُعرف أشجار القرار بكونها سهلة الفهم والتفسير نسبيًا، مما يجعلها ذات قيمة للذكاء الاصطناعي القابل للتفسير (XAI).
تتمثّل الفكرة الأساسية في تقسيم مجموعة البيانات إلى مجموعات فرعية أصغر فأصغر بناءً على قيم ميزات الإدخال، مما يؤدي إلى إنشاء بنية شجرية. تبدأ العملية من العقدة الجذرية التي تمثل مجموعة البيانات بأكملها. في كل عقدة، تختار الخوارزمية أفضل ميزة وعتبة لتقسيم البيانات بطريقة تزيد من نقاء أو تجانس المجموعات الفرعية الناتجة فيما يتعلق بالمتغير المستهدف. تشمل المعايير الشائعة للعثور على أفضل تقسيم شوائب جيني وكسب المعلومات (استنادًا إلى الإنتروبيا)، والتي تقيس الاضطراب أو العشوائية في المجموعة. وتستمر عملية التقسيم هذه بشكل متكرر حتى يتم استيفاء معيار التوقف، مثل الوصول إلى الحد الأقصى للعمق أو وجود حد أدنى لعدد العينات في عقدة ما أو تحقيق عقدة ورقة نقية (عقد تحتوي على عينات من فئة واحدة فقط). ولإجراء تنبؤ لنقطة بيانات جديدة، فإنه يجتاز الشجرة من الجذر نزولاً إلى عقدة ورقة بناءً على نتائج اختبارات السمات، ويكون التنبؤ هو الفئة الأكثرية أو القيمة المتوسطة في تلك الورقة. يمكن أن تؤثر المعالجة المسبقة الدقيقة للبيانات وهندسة السمات بشكل كبير على أداء شجرة القرار.
يمكن تصنيف أشجار القرار بشكل عام إلى نوعين رئيسيين:
تقدم أشجار القرار العديد من الفوائد:
ومع ذلك، فإن لها أيضًا عيوبًا:
تُستخدم أشجار القرار في مجالات مختلفة:
تُشكّل أشجار القرار أساسًا لطرق تجميعية أكثر تعقيدًا مثل الغابات العشوائية والأشجار المعززة بالتدرج (مثل XGBoost أو LightGBM). على سبيل المثال، تقوم الغابات العشوائية ببناء أشجار قرار متعددة على مجموعات فرعية مختلفة من البيانات والميزات وتجميع تنبؤاتها، مما يؤدي في كثير من الأحيان إلى دقة وقوة أفضل ضد الإفراط في التكييف مقارنةً بشجرة واحدة. على الرغم من قوتها في العديد من مشاكل البيانات المجدولة، إلا أن أشجار القرار تختلف بشكل كبير عن نماذج مثل الشبكات العصبية التلافيفية (CNNs) أو محولات الرؤية (ViT) المستخدمة في الرؤية الحاسوبية. نماذج مثل Ultralytics YOLO11 تستفيد من بنيات التعلم العميق المحسّنة لمهام مثل اكتشاف الأجسام وتصنيف الصور وتجزئة النماذج، والتي تتضمن معالجة بيانات معقدة وعالية الأبعاد مثل الصور، وهو مجال تكون فيه أشجار القرار الفردي أقل فعالية. ويوفر فهم النماذج التأسيسية مثل أشجار القرار سياقًا قيّمًا ضمن المشهد الأوسع للذكاء الاصطناعي والنمذجة التنبؤية. وتوفر أدوات مثل Scikit-learn تطبيقات شائعة لأشجار القرار، بينما تعمل منصات مثل Ultralytics HUB على تبسيط تطوير ونشر نماذج الرؤية المتقدمة.