Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Детекторы на основе Anchor

Узнайте, как детекторы на основе anchor революционизируют обнаружение объектов благодаря точной локализации, адаптивности масштаба и применению в реальном мире.

Детекторы на основе якорей – это базовый класс моделей обнаружения объектов в компьютерном зрении. Эти модели работают с использованием предопределенного набора прямоугольников, известных как якорные прямоугольники, для идентификации и локализации объектов на изображении. Якорные прямоугольники – это, по сути, сетка шаблонов различных размеров и соотношений сторон, которые размещаются по всему изображению. Модель прогнозирует, как сдвинуть и масштабировать эти якоря, чтобы они соответствовали истинным ограничивающим прямоугольникам объектов, а также оценку достоверности, указывающую на наличие объекта. Такой подход упрощает задачу поиска объектов, превращая ее в задачу регрессии и классификации относительно этих фиксированных якорей.

Яркими примерами архитектур, основанных на anchor-based, являются семейство R-CNN, такое как Faster R-CNN, и ранние одноэтапные детекторы, такие как SSD (Single Shot MultiBox Detector) и многие модели YOLO, включая весьма успешную Ultralytics YOLOv5.

Как работают детекторы на основе якорей

Основная идея детекции на основе anchor boxes заключается в использовании набора предопределенных опорных прямоугольников в качестве отправной точки. В процессе обучения модели детектор учится выполнять две основные задачи для каждого anchor box:

  1. Классификация: Определение, содержит ли опорный прямоугольник объект интереса или является просто фоном.
  2. Регрессия: Вычисление точных смещений (x, y, ширина, высота), необходимых для корректировки ограничивающей рамки, чтобы она плотно охватывала обнаруженный объект.

Эти прогнозы делаются детектирующей головой модели после обработки признаков изображения, извлеченных backbone. Поскольку один объект может быть обнаружен несколькими anchor boxes, для фильтрации избыточных обнаружений и сохранения только наиболее подходящего bounding box используется этап постобработки, называемый Non-Maximum Suppression (NMS) (подавление немаксимумов). Производительность этих моделей часто оценивается с использованием таких метрик, как mean Average Precision (mAP) (средняя точность) и Intersection over Union (IoU) (пересечение над объединением).

Детекторы на основе якорей и детекторы без якорей: сравнение

В последние годы детекторы без привязки к якорям (anchor-free detectors) стали популярной альтернативой. В отличие от моделей, основанных на якорях, подходы без якорей предсказывают местоположение и размеры объектов напрямую, часто путем определения ключевых точек (таких как центры или углы объектов) или предсказания расстояний от точки до границ объекта, устраняя необходимость в предопределенных формах якорей.

Ключевые различия включают:

  • Сложность: Модели на основе якорей требуют тщательного проектирования и настройки параметров якоря (размеры, соотношения, масштабы), которые могут зависеть от набора данных. Модели без якорей упрощают конструкцию головки обнаружения.
  • Гибкость: Методы без привязки могут лучше адаптироваться к объектам с необычными пропорциями или формами, плохо представленными фиксированным набором привязок.
  • Эффективность: Устранение anchors может уменьшить количество прогнозов, которые должна делать модель, что потенциально приведет к более быстрому выводу и упрощению постобработки.

Хотя детекторы на основе anchor, такие как YOLOv4, были очень успешными, многие современные архитектуры, включая Ultralytics YOLO11, перешли на конструкции без anchor, чтобы использовать их преимущества в простоте и эффективности. Вы можете изучить преимущества обнаружения без anchor в YOLO11 и увидеть сравнения между различными моделями YOLO.

Применение в реальном мире

Детекторы на основе якорей широко используются в различных приложениях, где объекты имеют относительно стандартные формы и размеры.

  • Автономное вождение: В решениях для автомобильной промышленности эти детекторы отлично подходят для идентификации транспортных средств, пешеходов и дорожных знаков. Предсказуемые формы этих объектов хорошо согласуются с предопределенными якорями, обеспечивая надежное обнаружение для таких компаний, как NVIDIA и Tesla.
  • Розничная аналитика: Для управления запасами на основе ИИ модели, основанные на привязках (anchor-based models), могут эффективно сканировать полки для подсчета продуктов. Одинаковый размер и форма упакованных товаров делают их идеальными кандидатами для этого подхода, помогая автоматизировать мониторинг запасов.
  • Безопасность и наблюдение: Идентификация людей или транспортных средств на отснятом материале с камер видеонаблюдения является еще одним важным вариантом использования. Это является основой для таких приложений, как руководство по системе охранной сигнализации Ultralytics.

Инструменты и обучение

Разработка и развертывание моделей обнаружения объектов, как на основе anchor-ов, так и без них, включает в себя использование фреймворков, таких как PyTorch или TensorFlow, и библиотек, таких как OpenCV. Платформы, такие как Ultralytics HUB, предлагают оптимизированные рабочие процессы для обучения пользовательских моделей, управления наборами данных и развертывания решений, поддерживая различные архитектуры моделей. Для дальнейшего обучения ресурсы, такие как Papers With Code, перечисляют самые современные модели, а курсы с платформ, таких как DeepLearning.AI, охватывают фундаментальные концепции.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена