Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

الضبط الفعال للبارامترات (PEFT)

اكتشف الضبط الدقيق الفعال للمعلمات (PEFT) لتكييف نماذج الذكاء الاصطناعي الكبيرة بأقل قدر من الموارد. وفّر التكاليف، وامنع التجاوز في التدريب، وحسّن النشر!

الضبط الدقيق الفعال للمعلمات (PEFT) هي استراتيجية متطورة في مجال التعلّم الآلي (ML) المصممة لتكييف النماذج الكبيرة الكبيرة المدربة مسبقًا لمهام نهائية محددة دون تحمل العبء الحسابي لإعادة تدريب الشبكة بأكملها. كما النماذج الأساسية في مجالات مثل اللغة الطبيعية والرؤية الحاسوبية (CV) في مجالات مثل اللغة الطبيعية إلى مليارات المعلمات، فإن التقليدية - التي تُحدِّث كل وزن في النموذج - قد أصبح مكلفًا للغاية بالنسبة للعديد من المستخدمين. يعالج PEFT هذا الأمر من خلال تجميد غالبية أوزان النموذج المدرب مسبقًا المدربة مسبقًا وتحديث مجموعة فرعية صغيرة فقط من المعلمات أو إضافة بعض الطبقات الجديدة القابلة للتدريب. هذا النهج يقلل بشكل كبير من عائق الأجهزة، مما يسمح للباحثين والمهندسين للباحثين والمهندسين بتخصيص أحدث النماذج باستخدام مع الحفاظ على الأداء يمكن مقارنته بالتدريب الكامل.

آليات عمل PEFT

المفهوم الأساسي وراء PEFT هو نقل التعلم، حيث يستفيد النموذج من المعرفة المكتسبة من مجموعة بيانات ضخمة (مثل ImageNet أو Common Crawl) لحل مشاكل جديدة ببيانات محدودة. على عكس الضبط الدقيق الكامل، يقوم PEFT بتعديل بنية النموذج أو عملية التدريب ليكون "فعالاً من حيث المعلمات فعالة." هذا يخلق بصمة صغيرة للنموذج المُعدَّل، غالبًا ما تكون بضعة ميغابايتات فقط، مقارنةً ب الجيجابايت المطلوبة لنسخة كاملة من النموذج. هذه الكفاءة ضرورية لمنع النسيان الكارثي، وهي ظاهرة يفقد فيها النموذج يفقد النموذج قدراته العامة الأصلية أثناء تعلم معلومات جديدة.

تشمل التقنيات الشائعة داخل مظلة PEFT ما يلي:

  • LoRA (التكيف منخفض الرتبة): تقوم هذه الطريقة الشائعة بحقن مصفوفات صغيرة قابلة للتدريب على تحليل الرتب في طبقات النموذج، مما يؤدي إلى تجميد الأوزان الأصلية. يتم الاستشهاد بها على نطاق واسع في أبحاث Microsoft بسبب لتوازنها بين السرعة والدقة.
  • المحولات: يتضمن ذلك إدراج وحدات وحدات شبكة عصبية صغيرة بين الطبقات الموجودة من الشبكة المدرّبة مسبقاً.
  • الضبط الفوري: يُستخدم بشكل أساسي مع نماذج اللغة، وهذا يضيف "موجهًا ناعمًا" قابلًا للتدريب إلى تسلسل الإدخال، موجهًا سلوك النموذج المجمد سلوك النموذج المتجمد.

تطبيقات واقعية

تلعب PEFT دورًا أساسيًا في إضفاء الطابع الديمقراطي على الوصول إلى أدوات الذكاء الاصطناعي القوية في مختلف الصناعات.

  • الزراعة الدقيقة: يستخدم المزارعون وشركات التكنولوجيا الزراعية نماذج PEFT لتكييف نماذج عامة العامة مثل YOLO11 لتحديد أمراض معينة في المحاصيل أو الآفات المحلية. باستخدام الذكاء الاصطناعي في الزراعة، يمكن ضبط النموذج المدرَّب على الأشياء العامة يمكن ضبطه بدقة على مجموعة بيانات صغيرة مخصصة من صور أوراق الشجر detect الآفات الموضعية بدقة عالية، وتشغيلها بكفاءة على الأجهزة المتطورة في الحقل.
  • التشخيص الطبي: في الرعاية الصحية والخصوصية وندرة البيانات هي التحديات الرئيسية. يمكن للمستشفيات استخدام تقنية PEFT لتكييف نماذج الرؤية من أجل لتحليل الصور الطبية، مثل اكتشاف الكسور في الأشعة السينية. نظرًا لأن النموذج الأساسي يظل مجمدًا، فإن التدريب يتطلب عددًا أقل من صور المريض للتقارب, مما يقلل من مخاطر الإفراط في التكييف ويحافظ على قدرة النموذج على التعرف على السمات البصرية العامة.

التنفيذ العملي

في سياق نماذج Ultralytics غالبًا ما تتحقق كفاءة المعلمات من خلال "تجميد" للشبكة أثناء التدريب. وهذا يضمن بقاء طبقات استخراج الميزة دون تغيير، ولا يتم تحديث سوى الرأس (جزء النموذج المسؤول عن إجراء التنبؤات النهائية) فقط.

يوضح المثال التالي كيفية تنفيذ شكل بسيط من التدريب الفعال من حيث المعلمات باستخدام Ultralytics YOLO عن طريق تجميد أول 10 طبقات من النموذج.

from ultralytics import YOLO

# Load the YOLO11 model (latest stable version)
model = YOLO("yolo11n.pt")

# Train the model on a specific dataset
# The 'freeze=10' argument freezes the first 10 layers (the backbone)
# This reduces the number of trainable parameters significantly
results = model.train(data="coco8.yaml", epochs=5, freeze=10)

PEFT مقابل المفاهيم ذات الصلة

يعد فهم الفرق بين مصطلح PEFT والمصطلحات المماثلة أمرًا حيويًا لاختيار الاستراتيجية الصحيحة:

  • الضبط الكامل: يقوم هذا بتحديث جميع المعلمات في الشبكة. يوفر أقصى قدر من المرونة القصوى، لكنه يتطلب موارد حوسبة وتخزينًا هائلاً لكل إصدار نموذج جديد. راجع هذا هذا الدليل حول الضبط الدقيق لأفضل الممارسات عندما لا تكون الموارد عندما لا تكون الموارد قيدًا.
  • هندسة مستعجل: يتضمن ذلك صياغة يتضمن صياغة مدخلات النص (الموجه) لتوجيه النموذج دون تغيير أي أوزان. على النقيض من ذلك تقوم بتحديث مجموعة صغيرة من المعلمات أو الأوزان بشكل دائم لتغيير كيفية معالجة النموذج للبيانات.
  • نقل التعلّم: هذا هو المفهوم الأوسع لإعادة استخدام المعرفة. PEFT هو تطبيق محدد وفعال للتعلم المنقول. يمكنك استكشاف تعريفات أعمق لهذه المفاهيم على منصات مثل صفحات تعليم الذكاء الاصطناعي الخاصة بشركة IBM.

من خلال تقليل التكلفة الحسابية للتكيف إلى أدنى حد ممكن، يسمح نظام PEFT بإنشاء نماذج عالية التخصص ل لمهام تتراوح بين إدراك المركبات ذاتية القيادة إلى تحليل صور الأقمار الصناعية, مما يجعل الذكاء الاصطناعي المتقدم في متناول مجتمع أوسع من المطورين.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن