Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تقطير المعرفة

اكتشف كيف يضغط تقطير المعرفة نماذج الذكاء الاصطناعي للحصول على استدلال أسرع، ودقة محسنة، وكفاءة نشر الأجهزة الطرفية.

تقطير المعرفة هي استراتيجية متطورة متطورة لتحسين النموذج في التعلم الآلي حيث يتم تدريب نموذج يتم تدريب نموذج "الطالب" المدمج على إعادة إنتاج أداء وسلوك نموذج "معلم" أكبر وأكثر تعقيدًا "معلم" أكبر. الهدف الأساسي هو نقل قدرات التعميم و"المعرفة" من شبكة المعلم الثقيلة إلى شبكة الطالب الخفيفة. تتيح هذه العملية نشر نماذج عالية الدقة عالية الدقة على أجهزة محدودة الموارد، مثل مثل أجهزة الحوسبة المتطورة، دون المعاناة من الانخفاض الكبير في الدقة الذي يصاحب عادةً البنى الأصغر. من خلال ضغط المعلومات، يمكن للمطورين يمكن للمطورين تحقيق زمن استنتاج أسرع وتقليل استخدام الذاكرة مع الحفاظ على قوة تنبؤية قوية.

كيف يعمل تقطير المعرفة؟

تعتمد العملية على مفهوم "العلامات اللينة". في التعلّم القياسي القياسية، يتم تدريب النماذج على "التسميات الصلبة" من بيانات التدريب (على سبيل المثال, صورة بنسبة 100% "قطة" و 0% "كلب"). ومع ذلك، ينتج نموذج المعلم المدرّب مسبقًا توزيعات احتمالية توزيعات احتمالية، تُعرف باسم التسميات اللينة، عبر جميع الفئات. على سبيل المثال، قد يتنبأ المعلم بصورة 90% قطة، و9% كلب، و1% سيارة. تحتوي هذه التسميات البسيطة هذه على معلومات غنية حول العلاقات بين بين الفئات، مما يشير إلى أن القطة المحددة تشبه الكلب إلى حد ما.

أثناء عملية التقطير، يتم تدريب نموذج الطالب على تقليل الفرق بين تنبؤاته وتوقعات المعلم التسميات الناعمة، غالبًا باستخدام دالة خسارة محددة مثل تباعد كولباك-ليبلر. يسمح هذا يسمح للطالب بتعلّم "المعرفة المظلمة" أو البنية الدقيقة للبيانات التي اكتشفها المعلم اكتشفها المعلم بالفعل. للحصول على فهم أساسي، غالبًا ما يشير الباحثون إلى ورقة جيفري هينتون البحثية الأساسية حول هذا الموضوع.

بينما تتعامل المكتبات عادةً مع حسابات الخسارة المعقدة داخليًا، فإن تهيئة نموذج الطالب للتدريب هو الخطوة العملية الأولى. فيما يلي كيفية تحميل نموذج طالب خفيف الوزن مثل YOLO11 باستخدام ultralytics الحزمة:

from ultralytics import YOLO

# Load a lightweight student model (YOLO11n)
# 'n' stands for nano, the smallest and fastest version
student_model = YOLO("yolo11n.pt")

# Train the student model on a dataset
# In a distillation workflow, this training would be guided by a teacher model's outputs
results = student_model.train(data="coco8.yaml", epochs=5, imgsz=640)

تطبيقات واقعية

يعد تقطير المعرفة أمرًا محوريًا في الصناعات التي تكون فيها الكفاءة أمرًا بالغ الأهمية مثل الدقة.

  • الرؤية الحاسوبية المتنقلة: في السيناريوهات التي تتطلب الاستدلال في الوقت الحقيقي، مثل الطائرات بدون طيار المستقلة أو تطبيقات الواقع المعزز على الهواتف الذكية، فإن نشر نماذج ضخمة غير ممكن. يقوم المهندسون بتقطير نماذج نماذج اكتشاف الأجسام الكبيرة إلى إصدارات فعالة مثل YOLO11n. وهذا يضمن تشغيل التطبيق بسلاسة على معالجات الأجهزة المحمولة مثل مثل Qualcomm Snapdragon دون استنزاف البطارية، مع الاستمرار في تحديد الأجسام بشكل صحيح.
  • معالجة اللغات الطبيعية (NLP): غالبًا ما تكون نماذج اللغات الكبيرة (LLMs) مرهقة للغاية بحيث لا يمكن النشر المباشر. يتم استخدام التقطير لإنشاء إصدارات أصغر وأسرع - مثل DistilBERT - والتي تحتفظ بمعظم قدرات النمذجة اللغوية لنماذج اللغات الكبيرة الأكبر حجماً. يسمح ذلك للمساعدين الصوتيين وروبوتات الدردشة الآلية بالعمل بزمن استجابة أقل، مما يوفر تجربة أفضل للمستخدمين. أفضل للمستخدم.

التمييز بين مصطلحات التحسين ذات الصلة

من المهم التفريق بين تقنية تقطير المعرفة والتقنيات الأخرى المستخدمة لتحسين كفاءة النموذج، حيث تعمل على مبادئ مختلفة.

  • التقليم النموذجي: تتضمن هذه التقنية تتضمن إزالة الخلايا العصبية أو الوصلات (الأوزان) الزائدة فعلياً من شبكة مدربة موجودة لتقليل حجمها. على عكس التقطير، الذي يقوم بتدريب بنية طالب جديدة من الصفر، فإن التقليم يعدل بنية النموذج الأصلي.
  • التكميم الكمي للنموذج: يقلل التكميم الكمي من دقة الأوزان العددية للنموذج، على سبيل المثال، تحويل الأعداد ذات الفاصلة العائمة 32 بت إلى أعداد صحيحة 8 بت. يقلل هذا من حجم النموذج ويسرّع الحساب على أجهزة مثل مثل وحدات المعالجة الحرارية TPU ولكن لا يغير بالضرورة بنية الشبكة.
  • نقل التعلّم: يتضمن هذا النهج يتضمن أخذ نموذج مُدرَّب مسبقًا و وضبطه على مجموعة بيانات جديدة لمهمة مختلفة. في حين أن كلاهما ينطوي على نقل المعرفة، إلا أن التعلّم التحويلي يتعلق بتكييف المجال (على سبيل المثال، ImageNet إلى للأشعة السينية الطبية)، بينما يركز التقطير على ضغط معرفة المهمة نفسها من نموذج كبير إلى نموذج أصغر.

من خلال الجمع بين هذه التقنيات - على سبيل المثال، تقطير المعلم إلى طالب، ثم تطبيق التكميم - يمكن للمطورين زيادة الأداء على الأنظمة المدمجة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن