تعرف على كيفية قيام رأس الكشف بالكشف عن الأجسام في الوقت الفعلي. اكتشف دوره في Ultralytics في التنبؤ بالمربعات المحيطة والعلامات بدقة عالية.
يعمل رأس الكشف كطبقة اتخاذ القرار النهائي في بنية الشبكة العصبية للكشف عن الكائنات . في حين أن الطبقات السابقة من النموذج مسؤولة عن فهم الأشكال والأنسجة والخصائص داخل الصورة، فإن رأس الكشف هو المكون المحدد الذي يفسر هذه المعلومات للتنبؤ بالضبط بالكائنات الموجودة وموقعها. وهو يحول البيانات المجردة عالية المستوى التي ينتجها مستخرج الميزات إلى نتائج قابلة للتنفيذ، وعادةً ما ينتج مجموعة من المربعات المحيطة بالأشياء المحددة مع تصنيفاتها المطابقة ودرجات الثقة.
لفهم وظيفة رأس الكشف بشكل كامل، من المفيد تصور أجهزة الكشف الحديثة على أنها تتكون من ثلاث مراحل أساسية، كل منها يخدم غرضًا متميزًا في مسار الرؤية الحاسوبية (CV):
تطور تصميم رؤوس الكشف بشكل كبير لتحسين السرعة والدقة، لا سيما مع الانتقال من الأساليب التقليدية إلى نماذج الاستدلال الحديثة في الوقت الفعلي.
تعد دقة رأس الكشف أمرًا بالغ الأهمية لنشر الذكاء الاصطناعي (AI) في البيئات الصناعية والبيئات التي تتطلب درجة عالية من الأمان. يمكن للمستخدمين بسهولة إضافة تعليقات توضيحية إلى البيانات وتدريب هذه الرؤوس المتخصصة باستخدام Ultralytics .
يوضح المثال التالي كيفية تحميل
يولو26 نموذج وفحص ناتج رأس الكشف الخاص به.
عند تشغيل الاستدلال، يعالج الرأس الصورة ويعيد النتيجة النهائية boxes تحتوي على إحداثيات و
معرفات الفئات.
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")
# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
# Print the bounding box coordinates and the predicted class
print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")
يوضح هذا التفاعل كيف يقوم رأس الكشف بترجمة تنشيطات الشبكة العصبية المعقدة إلى بيانات قابلة للقراءة يمكن للمطورين استخدامها في مهام لاحقة مثل تتبع الكائنات أو عدها.