اكتشف قوة أشجار القرار في تعلم الآلة للتصنيف والانحدار والتطبيقات الواقعية مثل الرعاية الصحية والمالية.
شجرة القرار هي خوارزمية مستخدمة على نطاق واسع وبديهية خوارزمية تعلُّم تحت الإشراف تقوم بنمذجة القرارات ونتائجها المحتملة في بنية شبيهة بالشجرة. إنها أداة أساسية في التعلم الآلي (ML) المستخدمة في كل من التصنيف ومهام الانحدار. يعمل النموذج من خلال تقسيم مجموعة البيانات إلى مجموعات فرعية أصغر بناءً على محددة، وإنشاء مخطط انسيابي حيث تمثل كل عقدة داخلية اختبارًا على سمة ما، وكل فرع يمثل نتيجة ذلك الاختبار، وتمثل كل عقدة ورقية تسمية الفئة النهائية أو القيمة المستمرة. بسبب شفافيتها، تحظى أشجار القرار بتقدير كبير في الذكاء الاصطناعي القابل للتفسير (XAI)، مما يسمح لعلماء البيانات بتتبع المنطق الدقيق وراء التنبؤ.
يتضمن بناء شجرة القرار عملية تسمى التقسيم التكراري. تبدأ الخوارزمية ببيانات بيانات التدريب بأكملها في العقدة الجذرية وتختار الميزة الميزة الأكثر أهمية لتقسيم البيانات، بهدف تعظيم نقاء المجموعات الفرعية الناتجة. مقاييس مثل نقاء جيني أو كسب المعلومات (على أساس الإنتروبيا) رياضيًا لتحديد التقسيم الأمثل في كل خطوة.
تستمر العملية حتى يتحقق معيار التوقف، مثل الوصول إلى الحد الأقصى للعمق أو عندما تحتوي العقدة على الحد الأدنى من العينات. على الرغم من قوتها، إلا أنّ أشجار القرار الأحادية عرضة ل الإفراط في التركيب، حيث يتعلم النموذج الضوضاء في بيانات التدريب بدلاً من الإشارة. تقنيات مثل تشذيب النموذج غالباً ما تُطبَّق لإزالة الفروع غير الضرورية غير ضرورية وتحسين قدرة النموذج على التعميم على بيانات غير مرئية بيانات الاختبار غير المرئية.
تنتشر "أشجار القرار" في كل مكان في الصناعات التي تتطلب اتخاذ قرارات قائمة على القواعد ومسارات تدقيق واضحة.
من المهم التمييز بين شجرة القرار المنفردة عن مجموعة الطرق الأكثر تعقيدًا الأكثر تعقيدًا التي تستخدمها كلبنات بناء:
في حين أن الرؤية الحاسوبية الحديثة تعتمد على التعلُّم العميق العميق، تظل أشجار القرار عنصرًا أساسيًا لتحليل البيانات الوصفية أو المخرجات المجدولة التي تولدها نماذج الرؤية. يستخدم المثال يستخدم المثال التالي مكتبة الشهيرة Scikit-learn لتدريب مصنف أساسي.
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
# Load dataset and split into training and validation sets
data = load_iris()
X_train, X_val, y_train, y_val = train_test_split(data.data, data.target, random_state=42)
# Initialize and train the Decision Tree
clf = DecisionTreeClassifier(max_depth=3, random_state=42)
clf.fit(X_train, y_train)
# Evaluate accuracy on unseen data
accuracy = clf.score(X_val, y_val)
print(f"Validation Accuracy: {accuracy:.2f}")
يوفر فهم أشجار القرار أساسًا متينًا لفهم المفاهيم الأكثر تقدمًا في الذكاء الاصطناعي (AI). فهي تمثل التحول من الأنظمة القائمة على القواعد اليدوية إلى المنطق الآلي القائم على البيانات. في خطوط الأنابيب المعقدة، فإن YOLO11 قد detect نموذج YOLO11 الكائنات في دفق الفيديو، بينما تحلل شجرة القرارات تحلل شجرة القرار النهائية تواتر ونوع الاكتشافات لتشغيل تنبيهات عمل محددة, يوضح كيف أن التعلّم العميق (DL) و والتعلّم الآلي التقليدي غالبًا ما يعملان جنبًا إلى جنب أثناء نشر النموذج.