Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Детекционная головка

Узнайте о важной роли detection heads в обнаружении объектов, уточняющих карты признаков для точного определения местоположения и классов объектов.

Детекционная головка — это критически важный компонент в архитектурах обнаружения объектов, который отвечает за создание окончательных прогнозов о наличии, местоположении и классе объектов на изображении или видео. Расположенная в конце нейронной сети, она принимает обработанные карты признаков, сгенерированные основной сетью и шеей модели, и преобразует их в ощутимые выходные данные. В частности, детекционная головка выполняет две основные задачи: она классифицирует потенциальные объекты по предопределенным категориям (например, «автомобиль», «человек», «собака») и выполняет регрессию для прогнозирования точных координат ограничивающего прямоугольника, который заключает в себе каждый обнаруженный объект.

Как работают detection heads (блоки обнаружения)

В типичной сверточной нейронной сети (CNN), используемой для обнаружения объектов, входное изображение проходит через серию слоев. Начальные слои (основная часть) извлекают низкоуровневые признаки, такие как края и текстуры, а более глубокие слои захватывают более сложные закономерности. Обнаруживающая головка — это заключительный этап, который синтезирует эти высокоуровневые признаки для получения желаемого результата.

Дизайн детектора является ключевым отличием между различными моделями обнаружения объектов. Некоторые детекторы разработаны для скорости, что делает их пригодными для вывода в реальном времени на периферийных устройствах, в то время как другие оптимизированы для максимальной точности. На производительность модели обнаружения, часто измеряемую такими метриками, как средняя точность (mAP), в значительной степени влияет эффективность ее детектора. Вы можете изучить сравнения моделей, чтобы увидеть, как работают различные архитектуры.

Детекторные головки в современных архитектурах

Современное глубокое обучение претерпело значительную эволюцию в конструкции голов обнаружения. Различие между детекторами на основе якорей и детекторами без якорей особенно важно.

  • Основанные на якорях головы: Эти традиционные головы используют набор предопределенных прямоугольников (якорей) различных размеров и соотношений сторон. Голова предсказывает, как сдвинуть и масштабировать эти якоря, чтобы они соответствовали объектам ground-truth на изображении.
  • Головы без якорей: В более современных моделях, включая Ultralytics YOLO11, часто используются головы без якорей. Эти головы предсказывают местоположение объектов напрямую, например, путем определения ключевых точек, таких как центр объекта. Такой подход может упростить конструкцию модели и повысить гибкость для объектов с необычными формами, как подробно описано в этом блоге о преимуществах YOLO11 без якорей.

Разработка этих компонентов опирается на мощные фреймворки, такие как PyTorch и TensorFlow, которые предоставляют инструменты для создания и обучения пользовательских моделей. Платформы, такие как Ultralytics HUB, еще больше упрощают этот процесс.

Применение в реальном мире

Эффективность детектора напрямую влияет на производительность многочисленных приложений ИИ, построенных на основе обнаружения объектов.

  1. Автономные транспортные средства: В самоуправляемых автомобилях детекторы объектов необходимы для идентификации и определения местоположения пешеходов, других транспортных средств и дорожных знаков в режиме реального времени. Скорость и точность этих прогнозов имеют решающее значение для безопасной навигации — технология, широко используемая такими компаниями, как Waymo. Это требует надежных детекторов, способных работать в разнообразных и динамичных средах.
  2. Безопасность и наблюдение: Detection heads обеспечивают работу автоматизированных систем мониторинга, выявляя несанкционированных лиц, оставленные объекты или конкретные события в видеопотоках. Эта возможность является основополагающей для таких приложений, как руководство по системе охранной сигнализации Ultralytics.
  3. Анализ медицинских изображений: Детекторы помогают радиологам, точно определяя местоположение аномалий, таких как опухоли или переломы, на медицинских снимках, что способствует более быстрой и точной диагностике. Вы можете узнать больше об этом применении, прочитав о использовании YOLO11 для обнаружения опухолей.
  4. Производство: На заводах детекторы позволяют автоматизировать контроль качества в производстве путем обнаружения дефектов в продукции на сборочных линиях.
  5. Розничная аналитика: Эти компоненты используются для таких приложений, как управление запасами и анализ моделей посещаемости клиентов.

Сложные детекторы в моделях, таких как YOLOv8, обучаются на масштабных эталонных наборах данных, таких как COCO, чтобы обеспечить высокую производительность в широком диапазоне задач и сценариев. Окончательный результат часто уточняется с использованием таких методов, как Non-Maximum Suppression (NMS), для фильтрации избыточных обнаружений. Для получения более глубоких знаний онлайн-курсы от таких провайдеров, как Coursera и DeepLearning.AI, предлагают комплексные пути обучения.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена