Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

خرائط الميزات

اكتشف كيف تعمل خرائط الميزات على تشغيل نماذج Ultralytics YOLO مما يتيح اكتشاف الأجسام بدقة وتطبيقات الذكاء الاصطناعي المتقدمة مثل القيادة الذاتية.

خريطة الميزة هي المخرجات الأساسية التي يتم إنشاؤها عندما يعمل مرشح التلافيف يعمل مرشح التلافيف على صورة مدخلات أو خريطة ميزة أخرى ضمن الشبكة العصبية التلافيفية (CNN). في سياق الرؤية الحاسوبية (CV)، تعمل هذه الخرائط تعمل هذه الخرائط بمثابة "عيون" الشبكة العصبية، حيث تسلط الضوء على وجود وموقع الخصائص المستفادة خصائص مثل الحواف أو القوام أو الزوايا أو الأشكال الهندسية المعقدة. من خلال تحويل بيانات البكسل الخام إلى تجريدات ذات مغزى، تمكّن خرائط الميزات النماذج المتطورة من أداء مهام تتراوح بين من تصنيف الصور إلى اكتشاف الأجسام في الوقت الحقيقي.

كيف يتم إنشاء خرائط الميزات

يتضمن توليد خريطة الميزة عملية رياضية تُعرف باسم الالتفاف. تنزلق مصفوفة متخصصة من الأوزان القابلة للتعلم، والتي يشار إليها باسم النواة أو المرشح، تنزلق عبر بيانات الإدخال. عند كل موضع، تقوم النواة بإجراء عملية ضرب وتجميع للعناصر، مما ينتج عنه قيمة واحدة في مصفوفة الخرج.

  • التفعيل: تمر القيم الناتجة عادةً عبر دالة تنشيط مثل ReLU، والتي تقدم لا خطية، مما يسمح للشبكة بتعلم أنماط معقدة.
  • الحفظ المكاني: على عكس الطبقات المتصلة بالكامل، تحافظ خرائط السمات على العلاقات المكانية, ما يعني أن القيمة العالية عند إحداثيات محددة تتوافق مع ميزة مكتشفة في نفس الموقع النسبي في الصورة الأصلية.
  • العمق: غالبًا ما تستخدم الطبقة التلافيفية الواحدة مرشحات متعددة، وتجميع المصفوفات ثنائية الأبعاد الناتجة لتكوين حجم ثلاثي الأبعاد من خرائط الميزات، وغالبًا ما يتم تصورها في مخططات بنية التعلم العميق (DL).

التعلّم الهرمي للميزات

البنى الحديثة، مثل العمود الفقري لشبكة ResNet المستخدمة في العديد من الأنظمة, تستفيد من الطبيعة الهرمية لخرائط السمات. مع تقدم البيانات عبر الشبكة، يزداد مستوى التجريد يزداد:

  1. الطبقات الضحلة: تلتقط خرائط الميزات الأولية تفاصيل منخفضة المستوى، مثل الخطوط الرأسية أو التدرجات اللونية أو التدرجات اللونية أو المنحنيات البسيطة. هذه تشكل أساس الإدراك البصري.
  2. الطبقات العميقة: في عمق الشبكة، يتم دمج هذه العناصر الأساسية. تمثل الخرائط الناتجة مفاهيم دلالية عالية المستوى، مثل شكل عجلة السيارة أو وجه الكلب. هذا التسلسل الهرمي أمر بالغ الأهمية ل أداء أحدث النماذج مثل نماذج مثل YOLO11, مما يمكّنها من التمييز بين الفئات المتشابهة بدقة عالية عالية الدقة.

تصور ذكاء الشبكة المرئي

غالبًا ما يقوم المطورون بتصور خرائط الميزات لتفسير ما تعلمه النموذج، وهي ممارسة أساسية في الذكاء الاصطناعي القابل للتفسير (XAI). تتيح أدوات مثل TensorBoard تسمح للمهندسين بفحص هذه الحالات الداخلية هذه. إذا كانت خريطة الميزات المخصصة detect السيارات تنشط على أشجار الخلفية، فهذا يشير إلى أن النموذج إلى أن النموذج قد يكون مفرطاً في ملاءمته للضوضاء. يعد هذا الفحص أمرًا حيويًا لتصحيح الأخطاء وتحسين متانة النموذج.

توضّح شيفرة Python التالية كيفية الوصول إلى أبعاد خريطة الميزة باستخدام الرمز ultralytics مكتبة عن طريق تسجيل خطاف على طبقة التلافيف.

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")


# Define a hook to print the shape of the feature map from the first layer
def hook_fn(module, input, output):
    print(f"Feature Map Output Shape: {output.shape}")


# Register the hook to the first convolutional layer of the model
model.model.model[0].register_forward_hook(hook_fn)

# Run inference on a dummy image to trigger the hook
model("https://ultralytics.com/images/bus.jpg")

تطبيقات واقعية

خرائط الميزات هي المحرك وراء العديد من التقنيات التحويلية:

  • المركبات ذاتية القيادة: في أنظمة القيادة الذاتية، مثل تلك التي التي طوّرتها شركة Waymo، تعالج خرائط الميزات موجزات الكاميرا لتحديد علامات الحارات والمشاة وإشارات المرور. تضمن الدقة المكانية لهذه الخرائط أن السيارة لا تعرف فقط ما هو موجود على الطريق، بل تعرف بالضبط مكان وجوده بالنسبة للسيارة.
  • التشخيص الطبي: في تحليل الصور الطبية، تقوم نماذج التعلم العميق تحليل نماذج التصوير بالرنين المغناطيسي أو التصوير المقطعي المحوسب. يتم تدريب خرائط السمات في هذه الشبكات على تسليط الضوء على الحالات الشاذة مثل الأورام أو أو الكسور. تُظهر الأبحاث المنشورة في مجلات مثل Nature Medicine كيف يمكن لهذه التنشيطات المحددة أن تساعد أخصائيي الأشعة من خلال تحديد المناطق ذات الأهمية بدقة عالية.

التمييز بين المفاهيم ذات الصلة

لفهم بنيات الشبكات العصبية فهماً كاملاً، من المفيد التفريق بين خرائط السمات والمصطلحات ذات الصلة:

  • خرائط الميزات مقابل استخراج الميزات: استخراج الميزات هو العملية الشاملة عملية استخلاص البيانات المفيدة من المدخلات الأولية. خريطة الميزة هي بنية البيانات المحددة الناتجة عن هذه العملية ضمن طبقة CNN.
  • خرائط الميزات مقابل التضمينات: بينما تحتفظ خرائط السمات بالأبعاد المكانية (الارتفاع والعرض), عادةً ما تكون التضمينات عادةً عبارة عن متجهات مسطحة ذات أبعاد أقل أقل بعدًا. تمثل التضمينات الجوهر الدلالي لصورة أو كائن بأكمله، وغالبًا ما تُستخدم في البحث عن التشابه في قاعدة بيانات المتجهات، بينما تُستخدم خرائط السمات للمهام التي تتطلب توطينًا مكانيًا مثل تجزئة الصورة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن