Detection Head
تعلم كيف يتيح رأس الكشف (detection head) الكشف عن الكائنات في الوقت الفعلي. استكشف دوره في Ultralytics YOLO26 للتنبؤ بصناديق التحديد (bounding boxes) والتسميات بدقة عالية.
يعمل رأس الكشف (detection head) كطبقة اتخاذ القرار النهائية في بنية الشبكة العصبية لاكتشاف الأشياء. وبينما تكون الطبقات الأولى من النموذج مسؤولة عن فهم الأشكال والقوام والسمات داخل الصورة، فإن رأس الكشف هو المكون المحدد الذي يفسر هذه المعلومات للتنبؤ بدقة بالأشياء الموجودة ومواقعها. يقوم بتحويل البيانات التجريدية عالية المستوى التي ينتجها مستخرج السمات (feature extractor) إلى نتائج قابلة للتنفيذ، وعادة ما يخرج مجموعة من صناديق الإحاطة (bounding boxes) التي تحيط بالأشياء المحددة جنباً إلى جنب مع تسميات الفئات الخاصة بها ودرجات الثقة (confidence scores).
Link to this sectionالتمييز بين الرأس والعمود الفقري (Backbone) والعنق (Neck)#
لفهم وظيفة رأس الكشف بشكل كامل، من المفيد تصور أجهزة الكشف الحديثة على أنها تتكون من ثلاث مراحل رئيسية، تخدم كل منها غرضاً متميزاً في خط أنابيب رؤية الحاسوب (CV):
- العمود الفقري (Backbone): هذا هو الجزء الأولي من الشبكة، وغالباً ما يكون شبكة عصبية تلافيفية (CNN) مثل ResNet أو CSPNet. وهو يعالج صورة الإدخال الخام لإنشاء خرائط السمات (feature maps) التي تمثل الأنماط البصرية.
- العنق (Neck): يقع بين العمود الفقري والرأس، ويعمل العنق على تحسين ودمج السمات من مقاييس مختلفة. تضمن البنيات مثل شبكة هرم السمات (FPN) قدرة النموذج على اكتشاف أشياء بأحجام متفاوتة من خلال تجميع السياق.
- الرأس (Head): هو المكون النهائي الذي يستهلك السمات المحسنة من العنق. ويقوم بتنفيذ المهمة الفعلية للتصنيف (ما هو هذا الشيء؟) والانحدار (أين يقع؟).
Link to this sectionالتطور: القائم على المراسٍ (Anchor-Based) مقابل الخالي من المراسٍ (Anchor-Free)#
لقد تطور تصميم رؤوس الكشف بشكل ملحوظ لتحسين السرعة والدقة، خاصة مع الانتقال من الأساليب التقليدية إلى نماذج الاستدلال في الوقت الفعلي (real-time inference) الحديثة.
- الرؤوس القائمة على المراسٍ (Anchor-Based Heads): اعتمدت أجهزة كشف الأشياء أحادية المرحلة (one-stage object detectors) التقليدية على صناديق مراسٍ (anchor boxes) محددة مسبقاً—وهي أشكال مرجعية ثابتة بأحجام متنوعة. يتنبأ الرأس بمدى تمدد أو إزاحة هذه المراسٍ لتناسب الشيء. تم تفصيل هذا النهج في الأبحاث التأسيسية حول Faster R-CNN.
- الرؤوس الخالية من المراسٍ (Anchor-Free Heads): تستخدم النماذج المتطورة، بما في ذلك أحدث إصدارات YOLO26، أجهزة كشف خالية من المراسٍ (anchor-free detectors). تتنبأ هذه الرؤوس بمراكز الأشياء وأبعادها مباشرة من البكسلات الموجودة في خرائط السمات، مما يلغي الحاجة إلى ضبط المراسٍ يدوياً. هذا يبسط البنية ويعزز قدرة النموذج على التعميم على أشكال الأشياء الجديدة، وهي تقنية غالباً ما ترتبط بـ اكتشاف الأشياء أحادي المرحلة بالتلافيف الكامل (FCOS).
Link to this sectionتطبيقات العالم الحقيقي#
تعتبر دقة رأس الكشف أمراً حيوياً لنشر الذكاء الاصطناعي (AI) في البيئات الحساسة للسلامة والبيئات الصناعية. يمكن للمستخدمين بسهولة تعليق البيانات وتدريب هذه الرؤوس المتخصصة باستخدام منصة Ultralytics.
- القيادة الذاتية: في الذكاء الاصطناعي للسيارات (AI for automotive)، يكون رأس الكشف مسؤولاً عن التمييز بين المشاة وإشارات المرور والمركبات الأخرى في الوقت الفعلي. يضمن الرأس المحسن للغاية بقاء زمن انتقال الاستدلال (inference latency) منخفضاً بما يكفي لتتمكن السيارة من الاستجابة فوراً.
- التشخيص الطبي: في تحليل الصور الطبية (medical image analysis)، يتم ضبط رؤوس الكشف بدقة لتحديد الشذوذ مثل الأورام في فحوصات التصوير بالرنين المغناطيسي. يجب أن يكون فرع الانحدار دقيقاً للغاية لتحديد الحدود الدقيقة للآفة، مما يساعد الأطباء في حلول الرعاية الصحية (healthcare solutions).
Link to this sectionمثال برمجي#
يوضح المثال التالي كيفية تحميل نموذج YOLO26 وفحص مخرجات رأس الكشف الخاص به. عند تشغيل الاستدلال، يقوم الرأس بمعالجة الصورة وإرجاع boxes النهائية التي تحتوي على الإحداثيات ومعرفات الفئات.
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")
# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
# Print the bounding box coordinates and the predicted class
print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")يسلط هذا التفاعل الضوء على كيفية ترجمة رأس الكشف لتنشيطات الشبكة العصبية المعقدة إلى بيانات قابلة للقراءة يمكن للمطورين استخدامها لمهام لاحقة مثل تتبع الأشياء (object tracking) أو العد.






