Instruction Tuning
اكتشف كيف يعمل ضبط التعليمات على مواءمة نماذج الذكاء الاصطناعي مع القصد البشري. تعلم كيفية تدريب Ultralytics YOLO26 ونماذج أخرى لاتباع توجيهات محددة لتحقيق مهام أفضل.
ضبط التعليمات هو تقنية متخصصة في تعلم الآلة تُستخدم لتدريب النماذج على اتباع توجيهات أو أوامر مستخدم محددة. على عكس التدريب المسبق القياسي، الذي يركز غالباً على التنبؤ بالكلمة التالية في تسلسل ما أو التعرف على الأنماط العامة في البيانات، يستفيد ضبط التعليمات من مجموعات البيانات المنسقة كمهام مباشرة. من خلال تعريض النموذج لأزواج المدخلات والمخرجات المهيكلة كأوامر صريحة واستجاباتها الصحيحة المقابلة، يمكن للمطورين تحويل نموذج أساسي للأغراض العامة إلى مساعد عالي الاستجابة وموجه نحو المهام. يُستخدم هذا النهج على نطاق واسع في الذكاء الاصطناعي التوليدي لمواءمة النماذج مع القصد البشري، مما يضمن أن تكون المخرجات ذات صلة وآمنة وقابلة للتنفيذ.
Link to this sectionكيف يعمل ضبط التعليمات#
تتضمن العملية تحديث أوزان النموذج باستخدام مجموعة بيانات منسقة بعناية من التعليمات. تغطي مجموعات البيانات هذه مجالات متنوعة، من حل المعادلات الرياضية إلى تحليل الصور. أثناء التدريب، يتعلم النموذج العلاقة الهيكلية بين الصياغة الأمرية للتعليمات (على سبيل المثال، "لخّص هذا النص" أو "حدد الكائنات في هذه الصورة") وتنسيق المخرجات المطلوب. توضح الأبحاث الحديثة، مثل دراسات حول FLAN (شبكة اللغة مضبوطة الضبط) من قبل Google، أن النماذج المضبوطة وفقاً للتعليمات تظهر قدرات محسنة بشكل كبير في التعلم الصفري عبر مهام لم يسبق رؤيتها.
Link to this sectionالتطبيقات الواقعية#
لقد أطلق ضبط التعليمات قدرات تحويلية عبر كل من الوسائط النصية والمرئية:
- مساعدو الذكاء الاصطناعي التفاعليون: تعتمد روبوتات المحادثة الحديثة بشكل كبير على ضبط التعليمات لمعالجة الحوار المعقد وتنفيذ منطق متعدد الخطوات. يضمن هذا الضبط أنه عندما يطلب المستخدم من النظام تنسيق البيانات ككائن JSON، يلتزم النموذج بصرامة بهذا القيد بدلاً من إنشاء حشو محادثي. تسلط أبحاث OpenAI حول InstructGPT الضوء على كيفية تقليل هذه التقنية للمخرجات السامة وتحسين المواءمة.
- نماذج الرؤية واللغة (VLMs): في الرؤية الحاسوبية، يُستخدم ضبط التعليمات لبناء أنظمة رؤية مرنة وقابلة للتوجيه. بدلاً من خط أنابيب اكتشاف الكائنات جامد يكتشف مجموعة ثابتة من الفئات، يمكن لنموذج الرؤية المضبوط حسب التعليمات معالجة أمر مثل "اعثر على المنتج المعيب على خط التجميع" وتعديل تركيزه ديناميكياً.
لإدارة مجموعات البيانات عالية الجودة المطلوبة لسير العمل المتقدمة هذه، غالباً ما تتجه الفرق إلى منصة Ultralytics، التي تبسط عملية تصنيف البيانات، وتنظيم المشاريع، ونشر التدريب المستند إلى السحابة.
Link to this sectionتمييز المفاهيم ذات الصلة#
لهيكلة خطوط أنابيب الذكاء الاصطناعي بشكل صحيح، من المهم التمييز بين ضبط التعليمات وتقنيات تحسين النماذج المشابهة:
- ضبط المطالبات مقابل ضبط التعليمات: ضبط المطالبات هو طريقة فعالة من حيث المعلمات تعمل على تحسين مجموعة صغيرة من "المطالبات اللينة" (موترات قابلة للتعلم) مع الحفاظ على تجميد النموذج الأساسي. في المقابل، يتضمن ضبط التعليمات عادةً تحديث النموذج بأكمله (أو أجزاء كبيرة منه) باستخدام التعلم الخاضع للإشراف على مجموعات بيانات التعليمات.
- الضبط الدقيق مقابل ضبط التعليمات: يقوم الضبط الدقيق التقليدي بتكييف نموذج مع مجال معين (على سبيل المثال، الأدبيات الطبية) دون تعليمه بالضرورة كيفية اتباع الأوامر. ضبط التعليمات هو مجموعة فرعية متميزة من الضبط الدقيق مصممة صراحةً لتحسين تنفيذ المهام وفهم اللغة الطبيعية عبر مجموعة واسعة من التعليمات المتنوعة.
Link to this sectionتكييف النماذج عملياً#
بالنسبة للمطورين الذين يبنون خطوط أنابيب رؤية حاسوبية مخصصة، يعد تكييف نموذج أساسي مع قيود مهمة محددة مطلباً شائعاً. بينما يتطلب ضبط التعليمات الكامل مجموعات بيانات ضخمة متخصصة، فإن تكييف نماذج قوية مثل Ultralytics YOLO26 لمهام مجال محدد يستخدم مبادئ مماثلة للتكيف الخاضع للإشراف.
from ultralytics import YOLO
# Load a pre-trained YOLO26 foundation model
model = YOLO("yolo26n.pt")
# Adapt the model weights to a custom task dataset using the PyTorch backend
# This process aligns the model's predictive capabilities with user-defined classes
results = model.train(data="custom_task.yaml", epochs=50, imgsz=640)من خلال الاستفادة من منهجيات التدريب المتقدمة هذه، يمكن للمطورين نشر أنظمة ذكاء اصطناعي قوية تفسر وتنفذ الأوامر المعقدة بشكل موثوق، مما يردم الفجوة بين التعلم العميق النظري والبرمجيات العملية التي تركز على المستخدم. لمزيد من القراءة حول آليات التدريب، استكشف وثائق PyTorch الرسمية حول تدريب الشبكات العصبية.






