اكتشف سرعة وفعالية أجهزة الكشف عن الأجسام ذات المرحلة الواحدة مثل YOLO وهي مثالية للتطبيقات في الوقت الحقيقي مثل الروبوتات والمراقبة.
كاشفات الأجسام أحادية المرحلة هي فئة من نماذج نماذج التعلم العميق (DL) المحسّنة للسرعة والكفاءة والكفاءة في مهام الرؤية الحاسوبية (CV). على عكس كاشفات الأجسام ذات المرحلتين، والتي التي تفصل عملية الكشف إلى مرحلتي اقتراح المنطقة والتصنيف، فإن البنى ذات المرحلة الواحدة تقوم بإجراء بالكشف عن الكائن في مسار تقييم واحد. من خلال تأطير المهمة على أنها مشكلة انحدار مباشر، تتنبأ هذه النماذج المربعات المحدودة واحتمالات الفئة في وقت واحد من الصور المدخلة. هذا النهج المبسط يسمح بمعالجة أسرع بكثير، مما يجعلها الخيار المفضل للتطبيقات التي تتطلب الاستدلال في الوقت الحقيقي.
في قلب كاشف المرحلة الواحدة توجد الشبكة العصبية التلافيفية (CNN) التي تعمل كعمود فقري ل لاستخراج السمات. تعالج الشبكة الصورة بأكملها مرة واحدة - ومن هنا جاء اسم "أنت تنظر مرة واحدة فقط" - مما يؤدي إلى إنشاء شبكة من خرائط الميزات. في وقت مبكر الأوائل، مثل كاشف المربعات المتعددة اللقطة الواحدة (SSD)، اعتمدت على على مربعات الربط المحددة مسبقًا للتعامل مع الأجسام ذات بمقاييس مختلفة. ومع ذلك، فإن التكرارات الحديثة مثل Ultralytics YOLO11 اعتمدت إلى حد كبير التصاميم الخالية من المراسي لتقليل التعقيد و وتحسين التعميم. يتضمن الناتج عادةً إحداثيات للتوطين ودرجة ثقة درجة الثقة التي تشير إلى احتمالية وجود وجود الجسم.
يكمن الفرق الأساسي بين النماذج ذات المرحلة الواحدة والنماذج ذات المرحلتين في المفاضلة بين السرعة والدقة. توفر البنى ذات المرحلتين، مثل عائلة R-CNN، دقة أعلى للأجسام الصغيرة أو المغلقة، ولكنها تتكبد تكاليف حسابية أعلى بسبب عملية متعددة الخطوات. دقة أعلى بالنسبة للأجسام الصغيرة أو المحجوبة ولكنها تتكبد تكاليف حسابية أعلى بسبب عمليتها متعددة الخطوات. على العكس من ذلك، تعطي أجهزة الكشف ذات المرحلة الواحدة الأولوية لانخفاض استنتاج منخفض، مما يتيح النشر على أجهزة أجهزة محدودة الموارد. التطورات الأخيرة، بما في ذلك تطور YOLOv1 إلى YOLO26 القادم YOLO26 القادم (المستهدف في أواخر عام 2025)، باستخدام التدريب الشامل ووظائف الخسارة المتقدمة لسد فجوة الدقة وغالباً ما تتطابق مع النماذج ذات المرحلتين أو تتجاوزها.
تقود كفاءة أجهزة الكشف ذات المرحلة الواحدة إلى الابتكار في العديد من القطاعات التي تكون فيها الاستجابة الفورية حاسمة:
لضمان الحصول على نتائج دقيقة، غالبًا ما تتنبأ هذه النماذج بعدة مربعات محتملة لجسم واحد. تقنيات ما بعد المعالجة تقنيات مثل التثبيط غير الأقصى (NMS) لتصفية هذه التنبؤات الزائدة عن الحاجة بناءً على التقاطع على الاتحاد (IoU) عتبات. يعد تنفيذ كاشف المرحلة الواحدة أمرًا بسيطًا ومباشرًا باستخدام مكتبات حديثة مثل PyTorch وحزمة وحزمةUltralytics Python .
يوضّح المثال التالي كيفية تشغيل الاستدلال باستخدام نموذج YOLO11 المدرّب مسبقًا:
from ultralytics import YOLO
# Load the YOLO11 model, a state-of-the-art one-stage detector
model = YOLO("yolo11n.pt")
# Run inference on a local image or URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected objects with bounding boxes
results[0].show()