Узнайте, как детекторы на основе anchor революционизируют обнаружение объектов благодаря точной локализации, адаптивности масштаба и применению в реальном мире.
Якорные детекторы - это фундаментальный класс моделей, используемых в компьютерном зрении (КВ) для решения задачи обнаружения объектов. Эти системы опираются на предопределенный набор ограничивающих рамок, известных как якорных ящиков, которые выступают в качестве опорных шаблонов, расположенных по всему изображению. Вместо того чтобы пытаться предсказать местоположение объекта с нуля, сеть вычисляет, насколько сместить и масштабировать эти фиксированные опорные точки, чтобы плотно подогнать их под объекты в сцене. Такой подход, по сути, превращает сложную задачу локализации в структурированную задачу регрессии, обеспечивая стабильную отправную точку для моделей глубокого обучения (DL) для изучения пространственных иерархии.
Процесс работы детектора на основе якорей включает в себя создание плотной сетки якорей на входном изображении, каждый из которых имеет разный масштаб и соотношение сторон для захвата объектов различных размеров и форм. разного масштаба и соотношения сторон, чтобы захватить объекты разных размеров и форм. По мере прохождения изображения через через основу модели, извлекаются и анализируются карты признаков. Для каждого местоположения якоря головка обнаружения выполняет два одновременных предсказания:
Во время обучения модели алгоритмы используют метрику, называемую Пересечение над объединением (IoU), чтобы чтобы определить, какие якоря в достаточной степени пересекаются с известными объектами. Только якоря с наибольшим IoU рассматриваются как положительные образцы. Поскольку этот процесс порождает тысячи ящиков-кандидатов, на этапе постобработки, известном как Немаксимальное подавление (NMS). чтобы удалить лишние наложения и сохранить только самые точные обнаружения.
Важно отличать эти модели от современного поколения безъякорных детекторов. В то время как основанные на якорях системы, такие как оригинальная Faster R-CNN и Ultralytics YOLOv5 полагаются на ручную настройку размеров якорей В то время как модели без якорей напрямую предсказывают центры объектов или ключевые точки.
Несмотря на появление новых методов, детекторы на основе якорей по-прежнему преобладают во многих устоявшихся конвейерах, где форма объектов формы являются постоянными и предсказуемыми.
Вы можете легко экспериментировать с обнаружением объектов, используя ultralytics упаковка. Хотя последние модели
являются безъякорными, фреймворк поддерживает различные архитектуры. Следующий пример демонстрирует, как запустить
вывод на изображении с помощью предварительно обученной модели:
from ultralytics import YOLO
# Load a pre-trained object detection model
# Note: YOLOv5 is a classic example of an anchor-based architecture
model = YOLO("yolov5su.pt")
# Perform inference on a local image
results = model("path/to/image.jpg")
# Display the resulting bounding boxes and class labels
results[0].show()
Понимание механики работы детекторов на основе якорей обеспечивает прочную основу для понимания эволюции компьютерного зрения и выбора дизайна, лежащего в основе передовых алгоритмов, таких как YOLO11 и будущих итераций, таких как YOLO26.