Prompt Tuning
استكشف ضبط المطالبات لتكييف النماذج الأساسية بكفاءة دون إعادة تدريب كاملة. تعلم كيف تقلل المطالبات اللينة من زمن الانتقال والتخزين لمهام الذكاء الاصطناعي مثل YOLO26.
ضبط الموجه هو تقنية فعالة في استخدام الموارد تُستخدم لتكييف النماذج الأساسية المدربة مسبقًا لمهام لاحقة محددة دون التكلفة الحسابية لإعادة تدريب الشبكة بالكامل. على عكس الضبط الدقيق التقليدي، الذي يقوم بتحديث جميع أو معظم معلمات النموذج، يقوم ضبط الموجه بتجميد أوزان النموذج المدربة مسبقًا وتحسين مجموعة صغيرة فقط من المتجهات القابلة للتعلم — التي تسمى "الموجهات اللينة" (soft prompts) — والتي تُضاف إلى بيانات الإدخال. يسمح هذا النهج لـ عمود فقري واحد وضخم بخدمة تطبيقات متخصصة متعددة في وقت واحد، مما يقلل بشكل كبير من متطلبات التخزين وتكاليف التبديل لـ زمن انتقال الاستدلال.
Link to this sectionآليات ضبط الموجه#
في سير عمل تعلم الآلة (ML) القياسي، يتم تحويل المدخلات مثل النصوص أو الصور إلى تمثيلات رقمية تُعرف بـ التضمينات. يقوم ضبط الموجه بإدراج متجهات تضمين إضافية قابلة للتدريب في تسلسل الإدخال هذا. خلال مرحلة التدريب، يستخدم النظام الانتشار العكسي لحساب التدرجات، لكن خوارزمية التحسين تقوم فقط بتحديث قيم الموجهات اللينة، تاركة هيكل النموذج الضخم دون تغيير.
تعد هذه الطريقة شكلاً من أشكال الضبط الدقيق الفعال للمعلمات (PEFT). من خلال تعلم هذه المتجهات المستمرة، يتم "توجيه" النموذج نحو المخرج المطلوب. على الرغم من أن هذا المفهوم نشأ في معالجة اللغات الطبيعية (NLP)، فقد تم تكييفه بنجاح لمهام الرؤية الحاسوبية (CV)، وغالبًا ما يُشار إليه باسم ضبط الموجه المرئي (VPT).
Link to this sectionالتمييز بين المفاهيم ذات الصلة#
لفهم فائدة ضبط الموجه، من الضروري التمييز بينه وبين المصطلحات المشابهة في مشهد الذكاء الاصطناعي:
- هندسة الموجهات: يتضمن ذلك صياغة تعليمات نصية مقروءة بشريًا (موجهات صلبة) يدويًا لتوجيه نموذج ذكاء اصطناعي توليدي. لا يتطلب ذلك أي برمجة أو تدريب. في المقابل، يستخدم ضبط الموجه تعلمًا خاضعًا للإشراف آليًا للعثور على تضمينات رقمية مثالية قد لا تتوافق مع كلمات اللغة الطبيعية.
- الضبط الدقيق الكامل: تقوم الطرق التقليدية بتحديث الشبكة العصبية بأكملها، مما يؤدي غالبًا إلى "النسيان الكارثي" للتدريب الأصلي. يحافظ ضبط الموجه على القدرات الأصلية للنموذج، مما يسهل الاستفادة من التعلم بنقل المعرفة عبر المهام المنفصلة.
- التعلم ببضع لقطات: يشير هذا عادةً إلى تقديم بضعة أمثلة في نافذة السياق الخاصة بـ LLM. يختلف ضبط الموجه لأنه يتعلم بشكل دائم معلمات يتم حفظها وإعادة استخدامها، بدلاً من مجرد تقديم سياق مؤقت.
Link to this sectionتطبيقات العالم الحقيقي#
يُمكّن ضبط الموجه من نشر الذكاء الاصطناعي بشكل قابل للتوسع في البيئات المحدودة الموارد، وهي فلسفة أساسية تشترك فيها منصة Ultralytics لإدارة النماذج.
-
دعم العملاء متعدد اللغات: يمكن لمؤسسة عالمية استخدام نموذج لغة مركزي ومجمد. من خلال تدريب موجهات لينة خفيفة الوزن للغات الإسبانية واليابانية والألمانية، يمكن للنظام تبديل اللغات فورًا. هذا يتجنب التكلفة الهائلة لاستضافة ثلاثة نماذج منفصلة بحجم جيجابايت، والاعتماد بدلاً من ذلك على ملفات موجهات بحجم كيلوبايت.
-
الذكاء الاصطناعي في الرعاية الصحية: غالبًا ما تعاني الصور الطبية من ندرة البيانات. يمكن للباحثين أخذ عمود فقري للرؤية للأغراض العامة (مثل Vision Transformer) واستخدام ضبط الموجه لتكييفه لاكتشاف تشوهات محددة، مثل أمراض الشبكية أو الأورام. هذا يحافظ على خصوصية بيانات المريض ويسمح بالتكيف السريع مع المعدات الطبية الجديدة دون إعادة تدريب كامل للنموذج.
Link to this sectionمثال على التنفيذ#
يوضح مثال PyTorch التالي المفهوم الميكانيكي الأساسي: تجميد الطبقات الرئيسية للنموذج وإنشاء معلمة منفصلة وقابلة للتدريب ("الموجه اللين") يتم تحسينها للتأثير على المخرجات.
import torch
import torch.nn as nn
# 1. Define a dummy backbone (e.g., a pre-trained layer)
backbone = nn.Linear(10, 5)
# 2. Freeze the backbone weights (crucial for prompt tuning)
for param in backbone.parameters():
param.requires_grad = False
# 3. Create a 'soft prompt' vector that IS trainable
# This represents the learnable embeddings prepended to inputs
soft_prompt = nn.Parameter(torch.randn(1, 10), requires_grad=True)
# 4. Initialize an optimizer that targets ONLY the soft prompt
optimizer = torch.optim.SGD([soft_prompt], lr=0.1)
# Verify that only the prompt is being trained
trainable_params = sum(p.numel() for p in [soft_prompt] if p.requires_grad)
print(f"Optimizing {trainable_params} parameters (Soft Prompt only)")Link to this sectionالأهمية للذكاء الاصطناعي المتطور (Edge AI) الحديث#
مع نمو النماذج بشكل أكبر، تصبح القدرة على تكييفها بتكلفة زهيدة أمرًا بالغ الأهمية. في حين أن معماريات مثل YOLO26 محسنة بالفعل للغاية من حيث الكفاءة، فإن مبادئ تجميد الأعمدة الفقرية والتكيف الفعال هي أساسية لمستقبل الذكاء الاصطناعي المتطور (Edge AI). تسمح التقنيات المشابهة لضبط الموجه للأجهزة ذات الذاكرة المحدودة بأداء مهام متنوعة — من اكتشاف الكائنات إلى التجزئة — ببساطة عن طريق تبديل ملفات تكوين صغيرة بدلاً من إعادة تحميل شبكات عصبية ضخمة.
بالنسبة للمطورين الذين يتطلعون إلى التدريب والنشر بكفاءة، فإن استخدام أدوات مثل منصة Ultralytics يضمن تحسين النماذج لأهداف أجهزتهم المحددة، مع الاستفادة من أفضل ممارسات MLOps الحديثة.






