Узнайте, как детекторы на основе anchor революционизируют обнаружение объектов благодаря точной локализации, адаптивности масштаба и применению в реальном мире.
Детекторы на основе якорей – это базовый класс моделей обнаружения объектов в компьютерном зрении. Эти модели работают с использованием предопределенного набора прямоугольников, известных как якорные прямоугольники, для идентификации и локализации объектов на изображении. Якорные прямоугольники – это, по сути, сетка шаблонов различных размеров и соотношений сторон, которые размещаются по всему изображению. Модель прогнозирует, как сдвинуть и масштабировать эти якоря, чтобы они соответствовали истинным ограничивающим прямоугольникам объектов, а также оценку достоверности, указывающую на наличие объекта. Такой подход упрощает задачу поиска объектов, превращая ее в задачу регрессии и классификации относительно этих фиксированных якорей.
Яркими примерами архитектур, основанных на anchor-based, являются семейство R-CNN, такое как Faster R-CNN, и ранние одноэтапные детекторы, такие как SSD (Single Shot MultiBox Detector) и многие модели YOLO, включая весьма успешную Ultralytics YOLOv5.
Основная идея детекции на основе anchor boxes заключается в использовании набора предопределенных опорных прямоугольников в качестве отправной точки. В процессе обучения модели детектор учится выполнять две основные задачи для каждого anchor box:
Эти прогнозы делаются детектирующей головой модели после обработки признаков изображения, извлеченных backbone. Поскольку один объект может быть обнаружен несколькими anchor boxes, для фильтрации избыточных обнаружений и сохранения только наиболее подходящего bounding box используется этап постобработки, называемый Non-Maximum Suppression (NMS) (подавление немаксимумов). Производительность этих моделей часто оценивается с использованием таких метрик, как mean Average Precision (mAP) (средняя точность) и Intersection over Union (IoU) (пересечение над объединением).
В последние годы детекторы без привязки к якорям (anchor-free detectors) стали популярной альтернативой. В отличие от моделей, основанных на якорях, подходы без якорей предсказывают местоположение и размеры объектов напрямую, часто путем определения ключевых точек (таких как центры или углы объектов) или предсказания расстояний от точки до границ объекта, устраняя необходимость в предопределенных формах якорей.
Ключевые различия включают:
Хотя детекторы на основе anchor, такие как YOLOv4, были очень успешными, многие современные архитектуры, включая Ultralytics YOLO11, перешли на конструкции без anchor, чтобы использовать их преимущества в простоте и эффективности. Вы можете изучить преимущества обнаружения без anchor в YOLO11 и увидеть сравнения между различными моделями YOLO.
Детекторы на основе якорей широко используются в различных приложениях, где объекты имеют относительно стандартные формы и размеры.
Разработка и развертывание моделей обнаружения объектов, как на основе anchor-ов, так и без них, включает в себя использование фреймворков, таких как PyTorch или TensorFlow, и библиотек, таких как OpenCV. Платформы, такие как Ultralytics HUB, предлагают оптимизированные рабочие процессы для обучения пользовательских моделей, управления наборами данных и развертывания решений, поддерживая различные архитектуры моделей. Для дальнейшего обучения ресурсы, такие как Papers With Code, перечисляют самые современные модели, а курсы с платформ, таких как DeepLearning.AI, охватывают фундаментальные концепции.