Chain-of-Thought Prompting

استكشف هندسة أوامر سلسلة الأفكار (CoT) لتعزيز الاستدلال في الذكاء الاصطناعي. تعلم كيف يساعد تقسيم المهام إلى خطوات منطقية في تحسين توليد الكود لـ Ultralytics YOLO26.

تعد استراتيجية التفكير المتسلسل (CoT) تقنية متقدمة في هندسة الأوامر (Prompt Engineering) تمكّن النماذج اللغوية الكبيرة (LLMs) من حل مهام الاستدلال المعقدة عبر تقسيمها إلى خطوات منطقية وسيطة. فبدلاً من طلب تقديم إجابة نهائية فورية من النموذج، تشجع تقنية CoT النظام على توليد "سلسلة من الأفكار" التي تحاكي حل المشكلات البشري. يعمل هذا الاستدلال خطوة بخطوة على تحسين الأداء بشكل ملحوظ في المهام التي تتضمن الحساب، والمنطق الرمزي، والاستدلال المنطقي العام، مما يغير طريقة تفاعلنا مع أنظمة الذكاء الاصطناعي (AI).

Link to this sectionآلية الاستدلال#

غالبًا ما تواجه النماذج اللغوية القياسية صعوبة في حل المشكلات متعددة الخطوات لأنها تحاول ربط المدخلات بالمخرجات مباشرة في تمريرة واحدة. يمكن لهذا النهج القائم على "الصندوق الأسود" أن يؤدي إلى حدوث أخطاء، خاصة عندما تكون القفزة المنطقية كبيرة جدًا. تعالج استراتيجية التفكير المتسلسل (CoT) ذلك عن طريق إدراج خطوات استدلالية بين سؤال الإدخال والمخرجات النهائية.

تعمل هذه العملية عمومًا بطريقتين:

التفكير المتسلسل بصفر من الأمثلة (Zero-Shot CoT): يقوم المستخدم بإلحاق عبارة تحفيزية بسيطة مثل "دعنا نفكر خطوة بخطوة" بالأمر. هذا ينشط قدرات الاستدلال الكامنة لدى النموذج دون الحاجة إلى أمثلة محددة.
التفكير المتسلسل بعدد قليل من الأمثلة (Few-Shot CoT): يتضمن الأمر بضعة أمثلة (نماذج) لأسئلة مقترنة بحلولها خطوة بخطوة. يستفيد هذا من التعلم ببضع أمثلة لإظهار النموذج بالضبط كيفية هيكلة منطقه قبل محاولة حل مشكلة جديدة.

من خلال توليد استدلال وسيط بشكل صريح، تتاح للنموذج فرص أكبر لتصحيح نفسه وتوفير الشفافية حول كيفية وصوله إلى استنتاج معين. وهذا أمر بالغ الأهمية للحد من الهلوسة في النماذج اللغوية الكبيرة، حيث قد تذكر النماذج حقائق غير صحيحة بثقة في حالات أخرى.

Link to this sectionتطبيقات العالم الحقيقي#

على الرغم من تطويرها في البداية للمنطق القائم على النصوص، إلا أن لاستراتيجية التفكير المتسلسل تطبيقات قوية عند دمجها مع مجالات الذكاء الاصطناعي الأخرى، مثل الرؤية الحاسوبية وتوليد الأكواد.

Link to this sectionتعزيز توليد الأكواد للرؤية الحاسوبية#

يستخدم المطورون استراتيجية CoT لتوجيه النماذج اللغوية الكبيرة في كتابة نصوص برمجية معقدة لمهام مثل اكتشاف الكائنات. بدلاً من طلب غامض مثل "اكتب كودًا للعثور على السيارات"، قد يقوم أمر CoT بهيكلة الطلب كالتالي: "أولاً، قم باستيراد المكتبات الضرورية. ثانيًا، قم بتحميل النموذج المدرب مسبقًا. ثالثًا، حدد مصدر الصورة. أخيرًا، قم بتشغيل حلقة التنبؤ." يضمن هذا النهج المهيكل أن الكود الذي تم توليده لنماذج مثل YOLO26 صحيح من الناحية النحوية وسليم من الناحية المنطقية.

Link to this sectionاتخاذ القرار الذاتي#

في مجال المركبات ذاتية القيادة، يجب على الأنظمة معالجة البيانات البصرية واتخاذ قرارات بالغة الأهمية تتعلق بالسلامة. يسمح نهج التفكير المتسلسل للنظام بالتعبير عن منطقه: "أكتشف وجود أحد المشاة بالقرب من ممر المشاة. المشاة يواجه الطريق. إشارة المرور خضراء بالنسبة لي، لكن المشاة قد يخطو إلى الطريق. لذلك، سأبطئ السرعة وأستعد للتوقف." هذا يجعل قرارات الذكاء الاصطناعي قابلة للتفسير وتتماشى مع مبادئ الذكاء الاصطناعي القابل للتفسير (XAI).

Link to this sectionالتفكير المتسلسل قيد التنفيذ#

على الرغم من أن استراتيجية CoT هي في الأساس تقنية لغة طبيعية، إلا أنه يمكن تنفيذها برمجيًا لضمان تفاعلات متسقة مع نماذج الرؤية. يوضح مثال Python التالي كيف يمكن للمطور هيكلة أمر لتوجيه نموذج لغوي كبير (تمت محاكاته هنا) في توليد كود استدلال صالح لـ منصة Ultralytics.

# Example of structuring a Chain-of-Thought prompt for an LLM
# This prompt guides the model to write a valid YOLO26 inference script

cot_prompt = """
Task: Write a Python script to detect objects using YOLO26.

Chain of Thought:
1. Import the YOLO class from the 'ultralytics' library.
2. Load the 'yolo26n.pt' model weights (the latest nano model).
3. Load a sample image using a URL or local path.
4. Run the predict() function and save the results.

Based on these steps, generate the Python code below:
"""

# In a real application, you would send 'cot_prompt' to an LLM API
print(f"Structured Prompt for LLM:\n{cot_prompt}")

Link to this sectionالتمييز بين المفاهيم ذات الصلة#

من المهم التمييز بين استراتيجية التفكير المتسلسل والمصطلحات المشابهة في مشهد تعلم الآلة (ML):

سلسلة الأوامر (Prompt Chaining): يتضمن هذا ربط استدعاءات نماذج متعددة ومنفصلة، حيث تصبح مخرجات خطوة واحدة هي مدخلات للخطوة التالية. تحدث استراتيجية CoT ضمن أمر واحد لاستنباط الاستدلال الداخلي، في حين تقوم سلسلة الأوامر بتنظيم سير عمل عبر تفاعلات متعددة.
التوليد المعزز بالاسترجاع (RAG): يركز RAG على جلب بيانات خارجية (مثل المستندات أو قواعد البيانات) لتعزيز معرفة النموذج. بينما تركز استراتيجية CoT على عملية الاستدلال نفسها. غالبًا ما يتم دمجهما معًا—استخدام RAG للحصول على الحقائق وCoT للاستدلال بشأنها.
ضبط الأوامر (Prompt Tuning): هذه طريقة ضبط دقيقة وفعالة من حيث البارامترات تعمل على تحسين الأوامر اللينة المستمرة (المتجهات) أثناء التدريب. بينما استراتيجية CoT هي استراتيجية لغة طبيعية منفصلة يتم تطبيقها عند الاستدلال في الوقت الفعلي دون تغيير أوزان النموذج.

Link to this sectionالنظرة المستقبلية#

مع استمرار تطور النماذج الأساسية (Foundation Models)، أصبحت استراتيجية التفكير المتسلسل ممارسة قياسية مثلى لإطلاق العنان لإمكاناتها الكاملة. تشير الأبحاث الصادرة عن مجموعات مثل Google DeepMind إلى أنه مع زيادة حجم النماذج، تتحسن قدرتها على أداء استدلال CoT بشكل كبير. يمهد هذا التطور الطريق لوكلاء أكثر موثوقية وذاتية قادرين على التعامل مع سير العمل المعقد في صناعات تتراوح من الرعاية الصحية إلى التصنيع الذكي.