اكتشف الدور الحاسم لرؤوس الاكتشاف في الكشف عن الكائنات، وصقل خرائط الميزات لتحديد مواقع الكائنات وفئاتها بدقة.
رأس الكشف هو المكوّن الأخير وربما الأكثر أهمية في نموذج الكشف عن الأجسام، حيث يعمل بمثابة طبقة صنع القرار التي تترجم ميزات الصورة المشفرة إلى تنبؤات قابلة للتنفيذ. يقع في نهاية الشبكة العصبية للتعلم العميق، وتحديداً بعد العمود الفقري والرقبة، يقوم رأس الكشف بمعالجة خرائط السمات عالية المستوى عالية المستوى لإنتاج المخرجات النهائية: فئة الكائن الكائن وموقعه الدقيق داخل الصورة. بينما تركز الطبقات السابقة من الشبكة على ميزة استخلاص السمات - تحديد الحواف والأنسجة والأنماط المعقدة - يفسر رأس الكشف هذه البيانات للإجابة عن "ما هو؟" و "أين هو؟"
تتمثل المسؤولية الأساسية لرئيس الكشف في أداء مهمتين متميزتين ولكن متزامنتين: التصنيف و والانحدار. في البنى الحديثة الحديثة للكشف عن الكائنات غالباً ما يتم التعامل مع هاتين المهمتين من قبل فروع منفصلة داخل الرأس، وهو خيار تصميمي يسمح للنموذج التخصص في جوانب مختلفة من التنبؤ.
عادةً ما يكون الناتج من رأس الكشف عبارة عن مجموعة كثيفة من الاكتشافات المرشحة. لوضع اللمسات الأخيرة على النتائج خطوات ما بعد المعالجة مثل الإخماد غير الأقصى (NMS) لتصفية المربعات المتداخلة والاحتفاظ فقط بالتنبؤات الأكثر ثقة.
يحدد تصميم رأس الكشف كيفية تعامل النموذج مع مشكلة تحديد مواقع الأجسام.
تُعد كفاءة ودقة رأس الكشف أمرًا حيويًا لنشر الذكاء الاصطناعي (AI) في البيئات المعقدة.
من المفيد تمييز رأس الكشف عن المكونات الرئيسية الأخرى لـ الشبكة العصبية التلافيفية (CNN):
يوضّح مقتطف كود Python التالي كيفية فحص رأس الكشف لنموذج YOLO11 المدرّب مسبقًا باستخدام
نموذج ultralytics الحزمة. هذا يساعد المستخدمين على فهم بنية الطبقة النهائية المسؤولة عن
الاستدلال.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Inspect the final detection head layer
# This typically reveals the number of classes (nc) and anchors/outputs
print(model.model.model[-1])
# Run inference to see the head's output in action
results = model("https://ultralytics.com/images/bus.jpg")
يعد فهم رأس الكشف أمرًا ضروريًا لأي شخص يتطلع إلى تحسين أداء النموذج أو تنفيذ مهام متقدمة مثل نقل التعلم، حيث غالبًا ما يتم استبدال الرأس لتدريب النموذج على مجموعة بيانات مخصصة جديدة. يجرّب الباحثون باستمرار تصميمات جديدة للرأس لتحسين مقاييس مثل متوسط الدقة المتوسطة (mAP)، مما يدفع حدود ما يمكن أن تحققه الرؤية الحاسوبية.