Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Детекторы на основе Anchor

Узнайте, как детекторы на основе якорей используют заранее определенные ограничительные рамки для обнаружения объектов. Изучите их основные механизмы, реальные примеры использования и сравните их с современным, более быстрым Ultralytics .

Детекторы на основе якорей являются основополагающим классом моделей обнаружения объектов в компьютерном зрении, которые используют набор заранее определенных ограничивающих рамок для локализации и classify . Вместо того, чтобы пытаться предсказать координаты объекта с нуля, эти системы начинают с фиксированных эталонных шаблонов, известных как якорные рамки. Затем нейронная сеть обучается определять, какой из этих шаблонов лучше всего соответствует объекту на изображении, и вычислять конкретные смещения — корректировки положения и размера — необходимые для идеального совмещения анкора с целью. Этот подход превращает сложную задачу произвольного прогнозирования координат в более стабильную задачу регрессии, что стало ключевым прорывом в разработке ранних архитектур глубокого обучения (DL), таких как Faster R-CNN и SSD.

Как работают механизмы на основе якорей

Основная работа детектора на основе якорей заключается в делении входного изображения на плотную сетку. В каждой ячейке этой сетки модель генерирует несколько якорных рамок с различными масштабами и соотношениями сторон, чтобы учесть различные формы объектов, такие как высокие пешеходы или широкие транспортные средства. По мере прохождения данных изображения через основу модели сеть извлекает богатые характеристики для выполнения двух одновременных задач:

  1. Классификация: модель присваивает каждому анкеру оценку вероятности, предсказывая, содержит ли он объект определенного класса (например, «автомобиль», «собака») или является просто фоновым шумом.
  2. Регрессия коробки: Для анкоров, которые были идентифицированы как содержащие объект, сеть прогнозирует поправочные коэффициенты для уточнения центра анкора. x, y координаты, ширина и высота, что приводит к плотному ограничивающая рамка.

Во время обучения модели эти детекторы используют метрику, называемую Intersection over Union (IoU), для сопоставления заранее определенных якорей с метками ground truth, предоставленными в наборе данных. Якоря с высоким перекрытием рассматриваются как положительные образцы. Поскольку этот процесс генерирует тысячи потенциальных обнаружений, алгоритм фильтрации, известный как Non-Maximum Suppression (NMS), применяется во время вывода, чтобы устранить избыточные коробки и сохранить только наиболее точное предсказание для каждого объекта.

Сравнение с детекторами без анкеров

Хотя методы на основе анкоров устанавливали стандарты в течение многих лет, в этой области произошел переход к детекторам без анкоров. Понимание этого различия жизненно важно для современных специалистов.

  • На основе анкоров: модели типа YOLOv5 и оригинальная RetinaNet полагаются на ручную настройку или алгоритмы кластеризации типа k-means для определения оптимальных размеров якорей для набора данных. Это обеспечивает стабильность, но может быть жестким, если объекты сильно различаются по форме.
  • Без якорей: Современные архитектуры, включая YOLO26, часто полностью исключают этап якорей. Они предсказывают центры и размеры объектов непосредственно по пикселям карты признаков, что снижает вычислительные затраты и упрощает поиск гиперпараметров. Этот «сквозной» подход, как правило, быстрее и проще в обучении на разнообразных данных.

Применение в реальном мире

Логика на основе якорей остается актуальной во многих устаревших и специализированных системах, где формы объектов предсказуемы и последовательны.

  • Мониторинг дорожного движения: в интеллектуальных транспортных системах камеры detect для управления потоком или выявления нарушений. Поскольку автомобили и грузовики имеют стандартные размеры, модели на основе анкеров могут быть настроены с учетом конкретных априорных вероятностей для максимальной точности и полноты.
  • Автоматизация розничной торговли: автоматизированные системы кассового учета используют компьютерное зрение для идентификации товаров. Поскольку упакованные товары, такие как коробки с хлопьями, имеют фиксированное соотношение сторон, анкеры обеспечивают надежную основу для сети, помогая ей различать похожие предметы в запутанной обстановке.

Пример реализации

Хотя в последних моделях YOLO26 используются головы без анкеров для достижения превосходной производительности, интерфейс для запуска обнаружения остается неизменным. Ultralytics и Python абстрагируются от сложности вопроса о том, использует ли модель анкеры или центральные точки, позволяя пользователям сосредоточиться на результатах.

Вот как загрузить модель и запустить инференцию для detect — рабочий процесс, который применяется независимо от базовой архитектуры:

from ultralytics import YOLO

# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")

# Run inference on an image source
# The model handles internal logic (anchor-based or anchor-free) automatically
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the first result with bounding boxes
results[0].show()

Дальнейшее чтение

Чтобы углубить свое понимание механизмов обнаружения, изучите фундаментальные исследования по Faster R-CNN, в которых была представлена сеть предложений регионов (RPN), или прочитайте о Single Shot MultiBox Detector (SSD), который оптимизировал обнаружение на основе якорей для повышения скорости. Для более широкого взгляда на эту область, COCO служит стандартным эталоном для оценки как моделей на основе якорей, так и моделей без якорей. Кроме того, продвинутые курсы на Coursera часто охватывают математические детали регрессии бокса и сопоставления якорей.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас