Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Якорные ящики

Узнайте, как якорные ящики позволяют обнаруживать объекты на основе якорей, использовать прайоры для классификации, регрессии и NMS, что находит применение в автономном вождении и розничной торговле.

Якорные ящики служат основополагающей концепцией в архитектуре многих модели обнаружения объектов, выступая в качестве предопределенных ориентиров для предсказания местоположения и размера объектов. Вместо того чтобы сканировать изображение в поисках объектов произвольных Модель использует эти фиксированные формы, определяемые высотой и шириной, в качестве отправных точек, или прайоры. Такой подход упрощает процесс обучения, превращая сложную задачу предсказания абсолютных координат предсказания абсолютных координат в более управляемую задачу регрессии, где сеть учится корректировать, или "смещать", эти шаблоны. шаблоны, чтобы они соответствовали истинным объектам. Этот техника сыграла ключевую роль в успехе таких популярных архитектур, как Faster R-CNN и ранних одноступенчатых детекторов.

Как функционируют якорные коробки

Механизм якорных ящиков заключается в покрытии входного изображения плотной сеткой с центрами. В каждой ячейке сетки генерируется несколько якорных боксов с различным соотношением сторон и Для размещения объектов различной формы, таких как высокие пешеходы или широкие автомобили, в каждой ячейке сетки создается несколько якорных боксов с различным соотношением сторон и масштабом. Во время обучения модели, система сопоставляет эти ячейки с реальным объектам с помощью метрики, называемой Пересечение над объединением (IoU). Якоря которые значительно пересекаются с целевым объектом, помечаются как положительные образцы.

Костяк детектора извлекает из изображения признаки, которые головка детектора использует для выполнения двух параллельных задач для каждого положительного якоря:

  • Классификация: Модель предсказывает вероятность того, что якорь содержит определенный объект класса, присваивая оценку доверия.
  • Бокс-регрессия: Сеть вычисляет точные смещения координат, необходимые для изменения формы якоря в окончательную ограничительную рамку, которая плотно охватывает объект.

Чтобы справиться с перекрывающимися прогнозами для одного и того же объекта, используется этап постобработки, известный как Немаксимальное подавление (NMS), отфильтровывает отсеивает лишние ящики, сохраняя только тот, который имеет наибольшую достоверность. Такие фреймворки, как PyTorch и TensorFlow предоставляют вычислительные инструменты, необходимые для Эффективная реализация этих сложных операций.

Якоря против смежных понятий

Понимание якорных ящиков требует их отличия от аналогичных терминов в компьютерного зрения (КВ).

  • Якорные коробки и ограничительные коробки: Якорная рамка - это теоретический, фиксированный шаблон, используемый в качестве гипотезы во время обработки. Ограничительная рамка - это окончательный, уточненный результат, содержащий координаты обнаруженного объекта.
  • Основанные на якорях и свободные от якорей: традиционные детекторы, основанные на якорях, такие как YOLOv5полагаются на эти ручные предустановки. В отличие от них, современные безъякорные детекторы, такие как Ultralytics YOLO11предсказывают центры объектов или ключевые точки непосредственно. Этот сдвиг упрощает построение модели, устраняя необходимость в настройке гиперпараметров, связанных с измерениями якоря размеров, что часто улучшает обобщение на таких наборах данных, как COCO.

Применение в реальном мире

Структурированная природа якорных ящиков делает их особенно эффективными в средах, где форма объектов последовательны и предсказуемы.

  1. Автономное вождение: Системы, разработанные для автономного вождения, основаны на обнаружении стандартных объектов, таких как легковые автомобили, грузовики и дорожные знаки. Поскольку эти объекты имеют относительно фиксированное соотношение сторон, якорные ящики можно настроить для их эффективного захвата. Такие компании, как Waymo, используют сложные конвейеры обнаружения для обеспечения безопасности в сложных безопасности в сложных дорожных сценариях.
  2. Управление запасами в розничной торговле: В Аналитика розничной торговли, системы технического зрения следят за полками, чтобы detect уровень запасов. Упакованные товары обычно имеют однородную форму, что позволяет моделям на основе якорей точно подсчитывать и выявлять отсутствующие на складе товары. Такая автоматизация способствует управление запасами на основе искусственного интеллекта, сокращая ручной труд.

Пример кода

В то время как современные модели, такие как YOLO11 , не имеют якорей, ранние итерации, такие как YOLOv5 , используют якорные коробки. Сайт ultralytics Пакет абстрагирует эту сложность, позволяя пользователям выполнять выводы без ручной конфигурирования якорей. Следующий пример демонстрирует загрузку предварительно обученной модели для detect объектов:

from ultralytics import YOLO

# Load a pretrained YOLOv5 model (anchor-based architecture)
model = YOLO("yolov5su.pt")

# Run inference on a static image from the web
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detected bounding boxes
results[0].show()

Для тех, кто интересуется математическими основами этих систем, существуют такие образовательные платформы, как Coursera и DeepLearning.AI предлагают углубленные курсы по конволюционным нейронным сетям и обнаружению объектов.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас