Two-Stage Object Detectors
Исследуй механику двухэтапных детекторов объектов, фокусируясь на предложениях областей и классификации. Узнай, почему современные модели, такие как Ultralytics YOLO26, теперь лидируют.
Двухстадийные детекторы объектов — это сложный класс архитектур глубокого обучения (DL), используемых в компьютерном зрении для обнаружения и определения местоположения объектов на изображении. В отличие от одностадийных аналогов, выполняющих обнаружение за один проход, эти модели разделяют задачу на две отдельные фазы: формирование предложений регионов (region proposal) и классификацию объектов. Этот двухэтапный подход был разработан для обеспечения высокой точности локализации, что сделало такие детекторы исторически важными в развитии искусственного интеллекта (AI). Разделяя понятия «где» и «что», двухстадийные детекторы часто достигают превосходной точности, особенно на мелких или перекрытых объектах, хотя обычно это происходит ценой больших вычислительных затрат и повышенной задержки вывода.
Link to this sectionДвухстадийный процесс#
Архитектура двухстадийного детектора основана на последовательном рабочем процессе, имитирующем то, как человек может внимательно изучать сцену.
-
Формирование предложений регионов: На первом этапе модель сканирует входное изображение, чтобы определить потенциальные области, где могут находиться объекты. Компонент, известный как Region Proposal Network (RPN), генерирует разреженный набор кандидатных рамок, часто называемых областями интереса (RoIs). Этот этап отфильтровывает большую часть фона, позволяя сети сосредоточить вычислительные мощности на релевантных участках.
-
Классификация и уточнение: На втором этапе модель извлекает признаки из этих кандидатных областей с помощью сверточных нейронных сетей (CNNs). Затем она присваивает каждой области определенную метку класса (например, «человек», «транспортное средство») и уточняет координаты bbox, чтобы плотно охватить объект.
Яркими примерами такой архитектуры являются семейство R-CNN, в частности Faster R-CNN и Mask R-CNN, которые в течение нескольких лет задавали стандарт для академических бенчмарков.
Link to this sectionСравнение с одностадийными детекторами#
Полезно отличать двухстадийные модели от одностадийных детекторов объектов, таких как Single Shot MultiBox Detector (SSD) и серия Ultralytics YOLO. В то время как двухстадийные модели отдают приоритет точности за счет раздельной обработки регионов, одностадийные модели формулируют задачу обнаружения как единую задачу регрессии, проецируя пиксели изображения напрямую в координаты bbox и вероятности классов.
Исторически это создавало компромисс: двухстадийные модели были точнее, но медленнее, в то время как одностадийные были быстрее, но менее точны. Однако современные достижения стерли эту грань. Передовые модели, такие как YOLO26, теперь используют архитектуры сквозного обучения (end-to-end), которые конкурируют с двухстадийными детекторами по точности, сохраняя при этом скорость, необходимую для вывода в реальном времени.
Link to this sectionРеальные приложения#
Из-за акцента на precision и recall, двухстадийные детекторы часто предпочтительнее в тех случаях, когда безопасность и детализация важнее, чем высокая скорость обработки.
- Медицинская диагностическая визуализация: В области AI в здравоохранении пропуск диагноза может иметь решающее значение. Двухстадийные архитектуры часто используются при анализе медицинских изображений для выявления аномалий, таких как опухоли на рентгеновских снимках или МРТ. Многоэтапный процесс помогает гарантировать, что мелкие поражения не будут пропущены на фоне сложной структуры тканей, предоставляя радиологам автоматизированную помощь с высокой степенью уверенности.
- Высокоточная промышленная инспекция: В умном производстве автоматизированные системы визуального контроля используют эти модели для обнаружения микроскопических дефектов на сборочных линиях. Например, обнаружение микротрещины в лопатке турбины требует высокой точности IoU, которую обеспечивают двухстадийные детекторы, гарантируя, что только безупречные компоненты перейдут на следующий этап производства.
Link to this sectionРеализация современного обнаружения#
Хотя двухстадийные детекторы заложили основу для высокоточного зрения, современные разработчики часто используют передовые одностадийные модели, которые предлагают сопоставимую производительность со значительно более простыми рабочими процессами развертывания. Ultralytics Platform упрощает обучение и развертывание этих моделей, эффективно управляя наборами данных и вычислительными ресурсами.
Следующий пример на Python демонстрирует, как загрузить модель и выполнить вывод с использованием современного рабочего процесса обнаружения объектов с помощью ultralytics, достигая результатов с высокой точностью, аналогичных традиционным двухстадийным подходам, но с большей эффективностью:
from ultralytics import YOLO
# Load the YOLO26 model, a modern high-accuracy detector
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Process results (bounding boxes, classes, and confidence scores)
for result in results:
result.show() # Display the detection outcomes
print(result.boxes.conf) # Print confidence scores





