Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

البحث في شجرة مونت كارلو (MCTS)

اكتشف كيف يدعم "البحث الشجري في مونت كارلو" (MCTS) منطق الذكاء الاصطناعي. تعلم كيفية دمج Ultralytics لتقييم الحالة البصرية والتخطيط في الأنظمة المعقدة.

البحث الشجري بطريقة مونت كارلو (MCTS) هو خوارزمية بحث تجريبية تُستخدم في عمليات صنع القرار المعقدة، لا سيما في مجالات التعلم الآلي و الذكاء الاصطناعي. وكما هو موضح في تعريفها على ويكيبيديا، تجمع خوارزمية MCTS بين دقة خوارزميات البحث الشجري وقوة العينات العشوائية (محاكاة مونت كارلو) لتقييم الخطوات الأكثر وعدًا في فضاء الحالة المحدد. وقد اشتهرت هذه الخوارزمية في الأصل بفضل نجاحها في ألعاب الطاولة المعقدة، وهي تعد الآن مكونًا أساسيًا في وكلاء الذكاء الاصطناعي الحديثة و أنظمة الاستدلال المتقدمة، بما في ذلك نماذج اللغة الكبيرة (LLMs) المتطورة.

كيفية عمل البحث الشجري في مونت كارلو

تقوم خوارزمية MCTS ببناء شجرة بحث بشكل تدريجي من خلال استكشاف الإجراءات الأكثر واعدة. وتعمل هذه الخوارزمية في إطار عملية قرار ماركوف، حيث تكرر أربع مراحل متتالية حتى يتم الوصول إلى الحد الأقصى للموارد الحاسوبية أو الوقت المحدد:

  1. الاختيار: بدءًا من العقدة الجذرية، تتجول الخوارزمية في الشجرة نزولاً من خلال اختيار العقد الفرعية التي تحقق التوازن بين الاستكشاف (تجربة مسارات جديدة) والاستغلال (تفضيل المسارات التي حققت مكافآت عالية في الماضي). وتُعد صيغة «الحد الأعلى للثقة المطبق على الأشجار» (UCT) طريقة قياسية تُستخدم لإدارة هذا التوازن.
  2. التوسيع: ما لم تنهي العقدة المحددة عملية المحاكاة، تُضاف عقدة فرعية واحدة أو أكثر لتوسيع شجرة البحث لتشمل الحالات التي لم يتم استكشافها بعد.
  3. المحاكاة (التنفيذ): يتم إجراء محاكاة سريعة، وغالبًا ما تكون عشوائية، بدءًا من العقدة التي تم توسيعها حديثًا وصولاً إلى نهاية السيناريو للتنبؤ بالنتيجة.
  4. الانتشار العكسي: يتم نشر نتيجة المحاكاة عائدًة إلى أعلى الشجرة، مع تحديث إحصائيات النجاح وقيم جميع العقد التي تم اجتيازها لتوجيه عمليات الاختيار المستقبلية.

تطبيقات العالم الحقيقي في الذكاء الاصطناعي

يُبرز مسح شامل لطرق البحث الشجري في مونت كارلو تنوعها في حل المشكلات التي تنطوي على مساحات بحث ضخمة يصعب معالجتها حسابياً.

شهادة MCTS مقابل المفاهيم ذات الصلة

لفهم تقنية MCTS بشكل كامل، من المفيد تمييزها عن تقنيات الذكاء الاصطناعي ذات الصلة:

  • التعلم المعزز (RL): في حين أن التعلم المعزز(RL) يُدرِّب النماذج بمرور الوقت لتعلم سياسة عامة، فإن خوارزمية MCTS هي عادةً خوارزمية تخطيط تُستخدم أثناء الاستدلال في الوقت الفعلي لتحديد أفضل إجراء فوري من حالة معينة. ومع ذلك، غالبًا ما يتم الجمع بين الاثنين؛ حيث يمكن لنماذج التعلم المعزز (RL) أن توفر القيمة التوجيهية لعقد خوارزمية MCTS.
  • شجرة الأفكار (ToT): ToT هي منصة توجيهية مصممة خصيصًا لنماذج اللغة الكبيرة (LLMs). وهي مستوحاة بشكل كبير من نموذج MCTS، حيث تنظم عملية توليد اللغة على شكل شجرة تمثل كل عقدة فيها "فكرة". ويُعد نموذج MCTS الأساس الخوارزمي الأوسع نطاقًا الذي تستند إليه منصة ToT والأطر المماثلة.

دمج تقنية الذكاء الاصطناعي للرؤية في MCTS

في مجال الذكاء الاصطناعي المدمج أو الأنظمة المستقلة، غالبًا ما يُستخدم الإدراك البصري كمقيِّم للحالة في عقدة MCTS. ومن خلال الاستفادة من Ultralytics يمكن للوكيل تقييم البيئة بسرعة لحساب درجة استدلالية خلال مرحلة المحاكاة.

فيما يلي مثال توضيحي يوضح كيفية استخدامYOLO Ultralytics لحساب مكافأة عقدة بسيطة أثناء عملية "الرول آوت" في خوارزمية MCTS.

from ultralytics import YOLO

# Load an Ultralytics YOLO26 model for state evaluation
model = YOLO("yolo26n.pt")


def evaluate_mcts_state(image_state):
    # Run inference to evaluate the visual environment
    results = model(image_state, verbose=False)

    # Example heuristic: Reward the MCTS path if an 'obstacle' is successfully avoided
    # Assume class 0 is 'obstacle'. Reward is 1 if path is clear, 0 if blocked.
    obstacle_detected = any(box.cls == 0 for box in results[0].boxes)
    return 0 if obstacle_detected else 1


# Simulate a rollout step
reward = evaluate_mcts_state("path_simulation_view.jpg")
print(f"MCTS Rollout Reward: {reward}")

بالنسبة للمطورين الذين يسعون إلى توسيع نطاق هذه العوامل الذكية، توفر Ultralytics أدوات قوية لتدريب ونشر نماذج الرؤية الأساسية. وهذا يجعل من الأسهل بكثير دمج قدرات إدراك سريعة وموثوقة في بنى البحث المعقدة التي يتم إنشاؤها باستخدام المكتبات الرياضية القياسية أو أطر عمل التعلم الآلي مثل PyTorch و TensorFlow.

لنبني مستقبل الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة