Узнайте, как детекторы на основе якорей революционизируют обнаружение объектов благодаря точной локализации, адаптивности к масштабу и реальным приложениям.
Детекторы на основе якорей являются основополагающим классом моделей обнаружения объектов в компьютерном зрении. Для идентификации и локализации объектов на изображении эти модели используют предопределенный набор ячеек, называемых якорными ящиками. Якорные ящики - это, по сути, сетка шаблонов различных размеров и соотношений сторон, которые располагаются на изображении в виде плитки. Модель предсказывает, как сместить и масштабировать эти якорные поля, чтобы они соответствовали истинным границам объектов, а также выставляет балл доверия, указывающий на наличие объекта. Такой подход упрощает задачу поиска объектов, превращая ее в задачу регрессии и классификации относительно этих фиксированных якорей.
Яркими примерами архитектур на основе якорей являются семейство R-CNN, например Faster R-CNN, и ранние одноступенчатые детекторы, такие как SSD (Single Shot MultiBox Detector), а также многие модели YOLO, включая весьма успешную Ultralytics YOLOv5.
Основная идея обнаружения на основе якорей заключается в использовании набора предопределенных опорных точек в качестве отправной точки. В процессе обучения модели детектор учится выполнять две основные задачи для каждого якорного блока:
Эти предсказания делаются головкой обнаружения модели после обработки особенностей изображения, извлеченных основной частью. Поскольку один объект может быть обнаружен несколькими якорными ящиками, для отсеивания лишних обнаружений и сохранения только наиболее подходящего ящика используется этап постобработки, называемый Non-Maximum Suppression (NMS). Производительность этих моделей часто оценивается с помощью таких метрик, как средняя точность (mAP) и пересечение с объединением (IoU).
В последние годы популярной альтернативой стали безъякорные детекторы. В отличие от моделей, основанных на якорях, безъякорные подходы предсказывают местоположение и размеры объектов напрямую, часто определяя ключевые точки (например, центры или углы объектов) или предсказывая расстояния от точки до границ объекта, что устраняет необходимость в предопределенных формах якорей.
Основные отличия включают:
Хотя детекторы на основе якорей, такие как YOLOv4, были весьма успешными, многие современные архитектуры, включая Ultralytics YOLO11, используют безъякорные конструкции, чтобы использовать их преимущества в простоте и эффективности. Вы можете изучить преимущества безъякорного обнаружения в YOLO11 и увидеть сравнение между различными моделями YOLO.
Детекторы на основе якорей широко используются в различных приложениях, где объекты имеют относительно стандартные формы и размеры.
Разработка и развертывание моделей обнаружения объектов, как основанных, так и не основанных на якорях, предполагает использование таких фреймворков, как PyTorch или TensorFlow, и библиотек, подобных OpenCV. Платформы, такие как Ultralytics HUB, предлагают оптимизированные рабочие процессы для обучения пользовательских моделей, управления наборами данных и развертывания решений, поддерживая различные архитектуры моделей. Для дальнейшего обучения на таких ресурсах, как Papers With Code, можно найти список самых современных моделей, а курсы на таких платформах, как DeepLearning.AI, охватывают базовые концепции.