Узнайте, как якорные ящики позволяют обнаруживать объекты на основе якорей, использовать прайоры для классификации, регрессии и NMS, что находит применение в автономном вождении и розничной торговле.
Якорные ящики служат основополагающей концепцией в архитектуре многих модели обнаружения объектов, выступая в качестве предопределенных ориентиров для предсказания местоположения и размера объектов. Вместо того чтобы сканировать изображение в поисках объектов произвольных Модель использует эти фиксированные формы, определяемые высотой и шириной, в качестве отправных точек, или прайоры. Такой подход упрощает процесс обучения, превращая сложную задачу предсказания абсолютных координат предсказания абсолютных координат в более управляемую задачу регрессии, где сеть учится корректировать, или "смещать", эти шаблоны. шаблоны, чтобы они соответствовали истинным объектам. Этот техника сыграла ключевую роль в успехе таких популярных архитектур, как Faster R-CNN и ранних одноступенчатых детекторов.
Механизм якорных ящиков заключается в покрытии входного изображения плотной сеткой с центрами. В каждой ячейке сетки генерируется несколько якорных боксов с различным соотношением сторон и Для размещения объектов различной формы, таких как высокие пешеходы или широкие автомобили, в каждой ячейке сетки создается несколько якорных боксов с различным соотношением сторон и масштабом. Во время обучения модели, система сопоставляет эти ячейки с реальным объектам с помощью метрики, называемой Пересечение над объединением (IoU). Якоря которые значительно пересекаются с целевым объектом, помечаются как положительные образцы.
Костяк детектора извлекает из изображения признаки, которые головка детектора использует для выполнения двух параллельных задач для каждого положительного якоря:
Чтобы справиться с перекрывающимися прогнозами для одного и того же объекта, используется этап постобработки, известный как Немаксимальное подавление (NMS), отфильтровывает отсеивает лишние ящики, сохраняя только тот, который имеет наибольшую достоверность. Такие фреймворки, как PyTorch и TensorFlow предоставляют вычислительные инструменты, необходимые для Эффективная реализация этих сложных операций.
Понимание якорных ящиков требует их отличия от аналогичных терминов в компьютерного зрения (КВ).
Структурированная природа якорных ящиков делает их особенно эффективными в средах, где форма объектов последовательны и предсказуемы.
В то время как современные модели, такие как YOLO11 , не имеют якорей, ранние итерации, такие как YOLOv5 , используют якорные коробки. Сайт
ultralytics Пакет абстрагирует эту сложность, позволяя пользователям выполнять выводы без ручной
конфигурирования якорей. Следующий пример демонстрирует загрузку предварительно обученной модели для detect объектов:
from ultralytics import YOLO
# Load a pretrained YOLOv5 model (anchor-based architecture)
model = YOLO("yolov5su.pt")
# Run inference on a static image from the web
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected bounding boxes
results[0].show()
Для тех, кто интересуется математическими основами этих систем, существуют такие образовательные платформы, как Coursera и DeepLearning.AI предлагают углубленные курсы по конволюционным нейронным сетям и обнаружению объектов.