يولو فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

ضبط الموجه

حسّن نماذج اللغة الكبيرة بكفاءة باستخدام ضبط الموجهات—قلل التكاليف، ووفر الموارد، وحقق القدرة على التكيف الخاصة بالمهمة دون عناء.

يعد ضبط المطالبات أسلوباً قوياً وفعالاً لتكييف النماذج الكبيرة المدربة مسبقاً، مثل النماذج اللغوية الكبيرة (LLMs)، مع مهام جديدة دون تغيير أوزان النموذج الأصلية. إنه شكل من أشكال الضبط الدقيق الفعال للمعلمات (PEFT) الذي يحافظ على تجميد مليارات المعلمات في النموذج الأساسي ويتعلم بدلاً من ذلك مجموعة صغيرة من "المطالبات اللينة" الخاصة بالمهمة. هذه المطالبات اللينة ليست نصاً قابلاً للقراءة البشرية ولكنها تضمينات قابلة للتعلم تسبق الإدخال، والتي توجه النموذج المجمد لإنتاج المخرجات المطلوبة لمهمة لاحقة محددة. يقلل هذا النهج بشكل كبير من التكلفة الحسابية والتخزين اللازمين للتكيف الخاص بالمهمة، كما هو موثق في ورقة بحث Google AI الأصلية.

الفكرة الأساسية هي تدريب بضعة آلاف أو ملايين من المعلمات الإضافية فقط (الموجه اللين) لكل مهمة، بدلاً من إعادة التدريب أو الضبط الدقيق للنموذج بأكمله، والذي يمكن أن يحتوي على مليارات المعلمات. هذا يجعل من الممكن إنشاء العديد من "وحدات المطالبات" المتخصصة لنموذج واحد مدرب مسبقًا، كل منها مصمم خصيصًا لمهمة مختلفة، دون إنشاء نسخ كاملة من النموذج. تساعد هذه الطريقة أيضًا في التخفيف من النسيان الكارثي، حيث ينسى النموذج المعلومات التي تعلمها سابقًا عند التدريب على مهمة جديدة.

تطبيقات واقعية

يتيح ضبط المطالبات تخصيص نماذج الأساس القوية لمجموعة واسعة من التطبيقات المتخصصة.

  • تحليل المشاعر المخصص: ترغب شركة في تحليل تعليقات العملاء حول منتجاتها المحددة. قد لا يفهم نموذج تحليل المشاعر ذو الأغراض العامة المصطلحات الخاصة بالصناعة. باستخدام الضبط الفوري، يمكن للشركة تكييف نموذج كبير مثل BERT عن طريق تدريب مجموعة صغيرة من المطالبات اللينة على مراجعات العملاء الخاصة بها والتي تم تصنيفها. يمكن للنموذج الناتج تصنيف التعليقات بدقة دون الحاجة إلى تدريب كامل للنموذج، مما يوفر رؤى أكثر دقة.
  • روبوتات الدردشة الطبية المتخصصة: تهدف مؤسسة رعاية صحية إلى بناء روبوت دردشة يجيب على أسئلة المرضى حول حالات طبية معينة. إن التدريب الكامل لنموذج لغوي كبير طبي (LLM) يستهلك الكثير من الموارد. بدلاً من ذلك، يمكنهم استخدام ضبط المطالبات (prompt tuning) على نموذج مدرب مسبقًا مثل GPT-4. من خلال تدريب مطالبة خاصة بالمهمة على مجموعة بيانات طبية منسقة، يتعلم روبوت الدردشة تقديم إجابات دقيقة ومراعية للسياق لهذا المجال، مما يجعل الذكاء الاصطناعي في الرعاية الصحية القوي أكثر سهولة.

ضبط الموجه مقابل المفاهيم ذات الصلة

من المهم التمييز بين ضبط الموجه (Prompt Tuning) والتقنيات المماثلة:

  • الضبط الدقيق (Fine-tuning): تقوم هذه الطريقة بتحديث جزء كبير، أو حتى جميع، معلمات النموذج المدرب مسبقًا على مجموعة بيانات جديدة. إنه أكثر كثافة من الناحية الحسابية ولكنه قد يحقق أحيانًا أداءً أعلى من خلال تكييف التمثيلات الداخلية للنموذج بعمق. غالبًا ما تغطي نصائح تدريب النموذج جوانب الضبط الدقيق.
  • هندسة المطالبات (Prompt Engineering): يركز هذا على التصميم اليدوي للمطالبات النصية الفعالة (المطالبات الصعبة) لتوجيه نموذج مُدرَّب مسبقًا ثابت. وهو ينطوي على صياغة التعليمات والأمثلة داخل النص المدخل نفسه ولا يتضمن تدريب أي معلمات جديدة. تندرج تقنيات مثل مطالبة سلسلة التفكير (chain-of-thought prompting) ضمن هذه الفئة.
  • إثراء المطالبات (Prompt Enrichment): تعمل هذه التقنية تلقائيًا على تحسين مطالبة المستخدم عن طريق إضافة سياق، على سبيل المثال، باستخدام جيل الاسترجاع المعزز (Retrieval-Augmented Generation (RAG))، قبل إرسالها إلى نموذج الذكاء الاصطناعي. على عكس ضبط المطالبات، فإنه يحسن استعلام الإدخال دون تدريب معلمات جديدة.
  • LoRA (تكييف منخفض الرتبة): تقنية PEFT أخرى تحقن مصفوفات منخفضة الرتبة صغيرة وقابلة للتدريب في الطبقات الموجودة (مثل آلية الانتباه) للنموذج المدرب مسبقًا. يقوم بتحديث أجزاء مختلفة من النموذج مقارنة بـ Prompt Tuning، الذي يركز فقط على تضمينات الإدخال. غالبًا ما يتم العثور على كليهما في مكتبات مثل مكتبة Hugging Face PEFT.

في حين أن ضبط الموجه يُطبق في الغالب على نماذج اللغات الكبيرة في معالجة اللغات الطبيعية (NLP)، إلا أن المبدأ الأساسي للتكيف الفعال ذو صلة عبر الذكاء الاصطناعي (AI). في رؤية الكمبيوتر (CV)، في حين أن الضبط الدقيق الكامل للنماذج مثل Ultralytics YOLO على مجموعات البيانات المخصصة أمر شائع لمهام مثل الكشف عن الكائنات، إلا أن طرق PEFT تكتسب زخماً، خاصة بالنسبة إلى النماذج متعددة الوسائط الكبيرة. تعمل منصات مثل Ultralytics HUB على تبسيط عملية تدريب ونشر نماذج الذكاء الاصطناعي المختلفة، وربما دمج مثل هذه التقنيات الفعالة في المستقبل.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة