Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Двухэтапные детекторы объектов

Откройте для себя возможности двухэтапных детекторов объектов — решений, ориентированных на точность, для точного обнаружения объектов в сложных задачах компьютерного зрения.

Двухэтапные детекторы объектов — это класс моделей компьютерного зрения, которые идентифицируют и локализуют объекты на изображении или видео посредством последовательного двухэтапного процесса. Эта методология известна своей высокой точностью, особенно в точной локализации объектов, хотя это часто достигается за счет более высокой задержки при выводе. Основная идея состоит в том, чтобы сначала определить потенциальные области интереса, а затем выполнить детальную классификацию и локализацию только для этих перспективных областей.

Двухэтапный процесс

Работа двухэтапного детектора разделена на отдельные последовательные фазы:

  1. Генерация предложений регионов: На первом этапе модель сканирует изображение, чтобы сгенерировать набор регионов-кандидатов, известных как «области интереса» (RoI) или предложения, которые, вероятно, содержат объект. Обычно это достигается с помощью подмодуля, называемого сетью предложений регионов (RPN), как это было широко представлено в архитектуре Faster R-CNN. Цель этого этапа — не классифицировать объекты, а просто уменьшить количество местоположений, которые необходимо проанализировать на втором этапе.

  2. Классификация объектов и уточнение ограничивающей рамки: На втором этапе каждая предложенная область передается в классификационную голову и регрессионную голову. Классификационная голова определяет класс объекта в пределах RoI (например, «человек», «автомобиль», «собака») или обозначает его как фон. Параллельно регрессионная голова уточняет координаты ограничивающей рамки, чтобы более точно соответствовать объекту. Этот целенаправленный анализ предварительно выбранных областей позволяет модели достичь высокой точности локализации.

Двухэтапные и одноэтапные детекторы: сравнение

Основное различие заключается в их операционном конвейере. Двухэтапные детекторы разделяют задачи локализации и классификации, в то время как одноэтапные детекторы объектов выполняют обе задачи одновременно за один проход.

  • Двухэтапные детекторы (например, семейство R-CNN): Приоритизируют точность. Двухэтапный процесс обеспечивает более детальное извлечение и уточнение признаков для каждого потенциального объекта, что приводит к повышению производительности на сложных сценах со множеством мелких или перекрывающихся объектов. Однако их сложность делает их вычислительно интенсивными и более медленными.
  • Одноэтапные детекторы (например, Ultralytics YOLO, SSD): Приоритет отдается скорости и эффективности. Рассматривая обнаружение объектов как единую задачу регрессии, они достигают скорости вывода в реальном времени, подходящей для приложений на периферийных AI устройствах. Хотя современные одноэтапные модели, такие как YOLO11, значительно сократили разрыв в точности, двухэтапные детекторы все еще могут быть предпочтительнее для задач, требующих максимально возможной точности.

Известные архитектуры

Эволюция двухэтапных детекторов была отмечена несколькими влиятельными моделями:

  • R-CNN (региональная сверточная нейронная сеть): Новаторская модель, которая первой предложила использовать региональные предложения со сверточной нейронной сетью (CNN). Она использовала внешний алгоритм под названием Selective Search для создания предложений.
  • Fast R-CNN: Улучшение, которое обрабатывало все изображение через CNN один раз, разделяя вычисления и значительно ускоряя процесс.
  • Faster R-CNN: Представила Region Proposal Network (RPN), интегрировав механизм предложения регионов в саму нейронную сеть для комплексного решения глубокого обучения.
  • Mask R-CNN: Расширяет Faster R-CNN, добавляя третью ветвь, которая выводит маску на уровне пикселей для каждого объекта, обеспечивая сегментацию экземпляров.

Применение в реальном мире

Высокая точность двухэтапных детекторов делает их ценными в сценариях, где точность имеет первостепенное значение:

  • Анализ медицинских изображений: Обнаружение незначительных аномалий, таких как небольшие опухоли, поражения или полипы, на медицинских снимках (КТ, МРТ) требует высокой точности для помощи в диагностике. Точная локализация имеет решающее значение для планирования лечения. Узнайте больше об ИИ в здравоохранении и исследованиях в таких журналах, как Radiology: Artificial Intelligence. Вы можете изучить наборы данных, такие как набор данных об опухолях головного мозга, для связанных задач.
  • Автономное вождение: Точное обнаружение и локализация пешеходов, велосипедистов, других транспортных средств и дорожных знаков, особенно небольших или частично скрытых, имеет решающее значение для систем безопасности автомобилей с автоматическим управлением. Такие компании, как Waymo, в значительной степени полагаются на надежные системы восприятия.
  • Детальное понимание сцены: Приложения, требующие детального понимания взаимодействий объектов или точного подсчета, выигрывают от более высокой точности.
  • Контроль качества в производстве: Выявление небольших дефектов или проверка размещения компонентов в сложных сборках часто требует высокой точности. Узнайте больше об ИИ в производстве.

Обучение этих моделей обычно включает в себя большие наборы данных с метками, такие как набор данных COCO, и тщательную настройку. Ultralytics предоставляет ресурсы для обучения моделей и понимания метрик производительности. Хотя Ultralytics фокусируется на эффективных одноэтапных моделях, таких как Ultralytics YOLO, понимание двухэтапных детекторов обеспечивает ценный контекст в более широкой области обнаружения объектов.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена