Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

الغابة العشوائية

اكتشف كيف تتفوق الغابة العشوائية، وهي خوارزمية تعلم جماعي قوية، في التصنيف والانحدار وتطبيقات الذكاء الاصطناعي الواقعية.

الغابة العشوائية هي خوارزمية قوية ومتعددة الاستخدامات خوارزمية تعلم تحت الإشراف تستخدم على نطاق واسع لكل من مهام التصنيف والانحدار. وهي تعمل كطريقة طريقة تجميعية، مما يعني أنها تجمع بين تنبؤات نماذج فردية متعددة لإنتاج مخرجات واحدة أكثر دقة. على وجه التحديد، تقوم الغابة العشوائية ببناء العديد من أشجار القرار أثناء عملية التدريب وتدمج نتائجها. بالنسبة لمشاكل التصنيف عادةً ما يكون التنبؤ النهائي هو الفئة المختارة من قبل غالبية الأشجار (النمط)، بينما بالنسبة لمشاكل التصنيف الانحدار، فهو متوسط تنبؤ الأشجار الفردية. هذا التجميع يقلل بشكل كبير من خطر الإفراط في ملاءمة بيانات التدريب، وهي مشكلة شائعة مع أشجار القرار الفردي واحدة.

كيف تعمل الغابة العشوائية (Random Forest)

يتم توليد "الغابة" من خلال مزيج من بناء الأشجار والعشوائية، المصممة لضمان التنوع بين النماذج. تعتمد الخوارزمية على آليتين رئيسيتين لتحقيق دقة تنبؤية عالية تنبؤية عالية:

  • تجميع التمهيد (التجميع بالتكديس): تتضمن هذه التقنية إنشاء عدة مجموعات فرعية من مجموعة البيانات الأصلية عن طريق أخذ عينات مع الاستبدال. يتم تدريب كل شجرة قرار في الغابة على عيّنة عشوائية مختلفة، مما يسمح للنموذج بالتعلّم من منظورات مختلفة من البيانات.
  • عشوائية الميزة: عند تقسيم عقدة عقدة أثناء بناء الشجرة، تأخذ الخوارزمية بعين الاعتبار مجموعة فرعية عشوائية فقط من عشوائية من الميزات بدلاً من جميع المتغيرات المتاحة. وهذا يمنع سمة واحدة مهيمنة من التأثير على كل شجرة، مما ينتج عنه نموذج أكثر قوة يُعرف باسم مجموعة النماذج.

تطبيقات واقعية

نظرًا لقدرته على التعامل مع مجموعات البيانات الكبيرة وإدارة القيم المفقودة، تعد الغابة العشوائية عنصرًا أساسيًا في التعلم الآلي التقليدي. بينما يُفضّل التعلّم العميق (DL) للبيانات غير المنظمة غير المنظمة مثل الصور، فإن الغابة العشوائية تتفوق مع البيانات المنظمة والمجدولة.

  • الذكاء الاصطناعي في مجال التمويل: تستخدم المؤسسات المالية الغابة العشوائية لتسجيل الائتمان والكشف عن الاحتيال. من خلال تحليل المعاملات والخصائص الديموغرافية للعملاء، يمكن للنموذج تحديد الأنماط التي تشير إلى وجود نشاط احتيالي أو تقييم احتمال التخلف عن سداد قرض بدقة عالية.
  • الذكاء الاصطناعي في الرعاية الصحية: في التشخيص الطبي في التشخيص الطبي، تساعد الخوارزمية في التنبؤ بنتائج المرضى ومخاطر الأمراض بناءً على الإلكترونية. وتساعد قدرتها على ترتيب أهمية الميزة الممارسين على فهم العلامات البيولوجية الأكثر الأكثر أهمية للتشخيص.
  • الذكاء الاصطناعي في الزراعة: يستخدم المزارعون ويستخدم المهندسون الزراعيون والمهندسون الزراعيون الغابة العشوائية لتحليل بيانات التربة وأنماط الطقس التاريخية للتنبؤ بإنتاجية المحاصيل و وتحسين تخصيص الموارد، مما يساهم في ممارسات زراعية أكثر ذكاءً وقائمة على البيانات.

مقارنة مع نماذج أخرى

يساعد فهم موقع الغابة العشوائية في مشهد الذكاء الاصطناعي في اختيار الأداة المناسبة للمهمة.

  • شجرة القرار مقابل الغابة العشوائية: A شجرة القرار الواحدة سهلة التفسير ولكنها عرضة للتباين الكبير. تضحي الغابة العشوائية ببعض قابلية التفسير من أجل الاستقرار والتعميم الأفضل على بيانات الاختبار.
  • XGBoost و LightGBM: هذه هي خوارزميات "تعزيز" تبني الأشجار بالتتابع، حيث تصحح كل شجرة جديدة الأخطاء من الشجرة السابقة. في المقابل، تقوم الغابة العشوائية ببناء الأشجار بالتوازي. غالباً ما يحقق التعزيز أداءً أعلى قليلاً في المنافسات ولكن قد يكون من الصعب ضبطها وأكثر حساسية للضوضاء.
  • الرؤية الحاسوبية (CV): للمهام البصرية المهام البصرية مثل اكتشاف الأجسام، تتفوق الغابة العشوائية العشوائية بشكل عام تتفوق على الشبكات العصبية التلافيفية (CNN). البنى الحديثة مثل YOLO11 تستخدم التعلّم العميق لالتقاط التسلسلات الهرمية المكانية في وحدات البكسل، والتي لا يمكن للطرق القائمة على الأشجار أن تصوغها بفعالية.

مثال على التنفيذ

في حين أن الأطر مثل ultralytics التركيز على التعلُّم العميق، عادةً ما يتم تنفيذ الغابة العشوائية باستخدام باستخدام مكتبة Scikit-learn. فيما يلي مثال على التنفيذ القياسي. يُستخدَم هذا النوع من النماذج أحيانًا في خطوط أنابيب ما بعد المعالجة classify متجهات الميزة المستخرجة بواسطة نماذج الرؤية.

from sklearn.datasets import make_classification
from sklearn.ensemble import RandomForestClassifier

# Generate synthetic structured data
X, y = make_classification(n_samples=1000, n_features=10, random_state=42)

# Initialize Random Forest with 100 trees
rf_model = RandomForestClassifier(n_estimators=100, max_depth=5, random_state=42)

# Train the model on the data
rf_model.fit(X, y)

# Predict class for a new data point
print(f"Predicted Class: {rf_model.predict([[0.5] * 10])}")

تظل الغابة العشوائية أداة أساسية في تحليلات البيانات، حيث تقدم توازناً في الأداء وسهولة الاستخدام للمشاكل التي تتضمن بيانات منظمة. بالنسبة للمطورين الذين ينتقلون إلى مهام الإدراك البصري المعقدة، فإن الانتقال إلى الشبكات العصبية والمنصات مثل Ultralytics YOLO هي الخطوة الطبيعية التالية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن