Откройте для себя скорость и эффективность одноступенчатых детекторов объектов, таких как YOLO, идеально подходящих для приложений реального времени, таких как робототехника и видеонаблюдение.
Одноэтапные детекторы объектов - это категория моделей глубокого обучения (ГОО), оптимизированных для скорости и эффективности в задачах компьютерного зрения (КВ). В отличие от двухэтапных детекторов объектов, которые разделяют процесс обнаружения на этапы предложения региона и классификации, одноэтапные архитектуры выполняют обнаружение объектов за один проход оценки. Посредством рассматривая задачу как проблему прямой регрессии, эти модели предсказывают граничные области и вероятности классов одновременно по входным изображениям. Такой оптимизированный подход позволяет значительно ускорить обработку, что делает их предпочтительным выбором для предпочтительным выбором для приложений, требующих прогнозирования в реальном времени.
В основе одноступенчатого детектора лежит сверточная нейронная сеть (CNN) которая служит основой для извлечения признаков. Сеть обрабатывает все изображение за один раз - отсюда и название "You Only Look Once" - создавая сетку карт признаков. Ранние архитектуры, такие как многоячеечный детектор с одним выстрелом (SSD), полагались на на предопределенные якорные ящики для работы с объектами различных масштабов. Однако современные итерации, такие как Ultralytics YOLO11 в основном используют безъякорные конструкции для снижения сложности и улучшения обобщения. Выходные данные обычно включают координаты для локализации и балл уверенности, указывающий на вероятность присутствия объекта.
Основное различие между одноступенчатыми и двухступенчатыми моделями заключается в компромиссе между скоростью и точностью. Двухступенчатые архитектуры, такие как семейство R-CNN, обычно обеспечивают более высокую точность при обнаружении мелких или закрытых объектов, но требуют больших вычислительных затрат из-за многоэтапного процесса. И наоборот, одноступенчатые детекторы ставят во главу угла низкую задержка вывода, что позволяет использовать их на аппаратных средствах с ограниченными ресурсами. Последние достижения, включая эволюция YOLOv1 в грядущий YOLO26 (запланирована на конец 2025 года), используют сквозное обучение и усовершенствованные функции потерь, чтобы сократить разрыв в точности разрыв в точности, часто совпадая или превосходя двухэтапные модели.
Эффективность одноступенчатых детекторов стимулирует инновации во многих отраслях, где важна оперативность реагирования. критически важна:
Для обеспечения точности результатов эти модели часто предсказывают несколько потенциальных ящиков для одного объекта. Постобработка такие методы, как Немаксимальное подавление (NMS) фильтруют эти избыточные предсказания на основе Пересечение над объединением (IoU) порогов. Реализовать одноступенчатый детектор несложно с помощью таких современных библиотек, как PyTorch и Ultralytics Python .
В следующем примере показано, как выполнить вывод с использованием предварительно обученной модели YOLO11 :
from ultralytics import YOLO
# Load the YOLO11 model, a state-of-the-art one-stage detector
model = YOLO("yolo11n.pt")
# Run inference on a local image or URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected objects with bounding boxes
results[0].show()