Узнайте, как детекторы на основе якорей используют заранее определенные ограничительные рамки для обнаружения объектов. Изучите их основные механизмы, реальные примеры использования и сравните их с современным, более быстрым Ultralytics .
Детекторы на основе якорей являются основополагающим классом моделей обнаружения объектов в компьютерном зрении, которые используют набор заранее определенных ограничивающих рамок для локализации и classify . Вместо того, чтобы пытаться предсказать координаты объекта с нуля, эти системы начинают с фиксированных эталонных шаблонов, известных как якорные рамки. Затем нейронная сеть обучается определять, какой из этих шаблонов лучше всего соответствует объекту на изображении, и вычислять конкретные смещения — корректировки положения и размера — необходимые для идеального совмещения анкора с целью. Этот подход превращает сложную задачу произвольного прогнозирования координат в более стабильную задачу регрессии, что стало ключевым прорывом в разработке ранних архитектур глубокого обучения (DL), таких как Faster R-CNN и SSD.
Основная работа детектора на основе якорей заключается в делении входного изображения на плотную сетку. В каждой ячейке этой сетки модель генерирует несколько якорных рамок с различными масштабами и соотношениями сторон, чтобы учесть различные формы объектов, такие как высокие пешеходы или широкие транспортные средства. По мере прохождения данных изображения через основу модели сеть извлекает богатые характеристики для выполнения двух одновременных задач:
x, y координаты, ширина и высота, что приводит к плотному
ограничивающая рамка.
Во время обучения модели эти детекторы используют метрику, называемую Intersection over Union (IoU), для сопоставления заранее определенных якорей с метками ground truth, предоставленными в наборе данных. Якоря с высоким перекрытием рассматриваются как положительные образцы. Поскольку этот процесс генерирует тысячи потенциальных обнаружений, алгоритм фильтрации, известный как Non-Maximum Suppression (NMS), применяется во время вывода, чтобы устранить избыточные коробки и сохранить только наиболее точное предсказание для каждого объекта.
Хотя методы на основе анкоров устанавливали стандарты в течение многих лет, в этой области произошел переход к детекторам без анкоров. Понимание этого различия жизненно важно для современных специалистов.
Логика на основе якорей остается актуальной во многих устаревших и специализированных системах, где формы объектов предсказуемы и последовательны.
Хотя в последних моделях YOLO26 используются головы без анкеров для достижения превосходной производительности, интерфейс для запуска обнаружения остается неизменным. Ultralytics и Python абстрагируются от сложности вопроса о том, использует ли модель анкеры или центральные точки, позволяя пользователям сосредоточиться на результатах.
Вот как загрузить модель и запустить инференцию для detect — рабочий процесс, который применяется независимо от базовой архитектуры:
from ultralytics import YOLO
# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")
# Run inference on an image source
# The model handles internal logic (anchor-based or anchor-free) automatically
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the first result with bounding boxes
results[0].show()
Чтобы углубить свое понимание механизмов обнаружения, изучите фундаментальные исследования по Faster R-CNN, в которых была представлена сеть предложений регионов (RPN), или прочитайте о Single Shot MultiBox Detector (SSD), который оптимизировал обнаружение на основе якорей для повышения скорости. Для более широкого взгляда на эту область, COCO служит стандартным эталоном для оценки как моделей на основе якорей, так и моделей без якорей. Кроме того, продвинутые курсы на Coursera часто охватывают математические детали регрессии бокса и сопоставления якорей.