Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Якорные ящики

Узнайте, как якорные ящики позволяют обнаруживать объекты на основе якорей, использовать прайоры для классификации, регрессии и NMS, что находит применение в автономном вождении и розничной торговле.

Якорные ящики являются основополагающим компонентом многих моделей обнаружения объектов, основанных на якорях, и представляют собой предопределенный набор опорных ящиков с определенной высотой и шириной. Эти ящики выступают в роли предикторов, или обоснованных предположений, о потенциальном расположении и масштабе объектов на изображении. Вместо того чтобы искать объекты вслепую, модели используют эти якоря в качестве отправных точек, прогнозируя смещения для уточнения их положения и размера в соответствии с реальными объектами. Такой подход превращает сложную задачу локализации объектов в более управляемую проблему регрессии, где модель учится корректировать эти шаблоны, а не генерировать коробки с нуля.

Как работают анкерные коробки

Основной механизм заключается в том, что изображение покрывается плотной сеткой якорных ящиков, расположенных в разных местах. В каждой позиции используется несколько якорей с разным масштабом и соотношением сторон, чтобы обеспечить эффективное обнаружение объектов различных форм и размеров. В процессе обучения модели основная часть детектора сначала извлекает карту признаков из входного изображения. Затем головка обнаружения использует эти признаки для выполнения двух задач для каждого якорного блока:

  • Классификация: Она предсказывает вероятность того, что в ячейке содержится интересующий объект, присваивает метку класса и балл доверия.
  • Регрессия: Вычисляет точные поправки (или смещения), необходимые для преобразования якорной рамки в конечную ограничительную рамку, плотно охватывающую объект.

Модель использует такие метрики, как Intersection over Union (IoU), чтобы определить, какие якорные ящики лучше всего соответствуют наземным объектам во время обучения. После предсказания применяется этап постобработки под названием Non-Maximum Suppression (NMS) для устранения избыточных и перекрывающихся боксов для одного и того же объекта.

Якорные ящики в сравнении с другими концепциями

В компьютерном зрении важно отличать якорные ящики от смежных терминов:

  • Ограничительная рамка: Якорная рамка - это предварительно заданный шаблон, используемый в процессе обнаружения, а ограничительная рамка - это окончательный, уточненный результат, который точно локализует обнаруженный объект.
  • Детекторы без якорей: Хотя модели на основе якорей, такие как YOLOv5 и семейство Faster R-CNN, полагаются на эти предустановки, современные архитектуры все чаще переходят на безъякорные детекторы. Такие модели, как Ultralytics YOLO11, предсказывают местоположение объектов напрямую, определяя ключевые точки или центры, что упрощает конструкцию модели и позволяет повысить производительность при работе с объектами нестандартной формы. Подробнее о преимуществах безъякорной конструкции в YOLO11.

Применение в реальном мире

Структурированный подход к якорным ящикам делает их эффективными в сценариях, где объекты имеют предсказуемые формы и размеры.

  1. Автономное вождение: В решениях для автомобильной промышленности детекторы на основе якорей отлично справляются с идентификацией автомобилей, пешеходов и дорожных знаков. Относительно одинаковые соотношения сторон этих объектов хорошо согласуются с заданными якорями, что обеспечивает надежное обнаружение для систем, разработанных такими компаниями, как NVIDIA и Tesla.
  2. Аналитика розничной торговли: Для управления запасами на основе ИИ эти модели могут эффективно сканировать полки для подсчета товаров. Однородный размер и форма упакованных товаров делают их идеальными кандидатами для применения подхода на основе якорей, помогая автоматизировать контроль запасов и сократить ручные усилия.

Эти модели обычно разрабатываются с помощью мощных фреймворков глубокого обучения, таких как PyTorch и TensorFlow. Для продолжения обучения такие платформы, как DeepLearning.AI, предлагают комплексные курсы по основам компьютерного зрения.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена