Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Детекционная головка

Узнайте о важной роли detection heads в обнаружении объектов, уточняющих карты признаков для точного определения местоположения и классов объектов.

Головка обнаружения - это последний и, возможно, самый важный компонент модели обнаружения объектов, служащий в качестве слой принятия решений, который преобразует закодированные характеристики изображения в действенные прогнозы. Расположена в самом конце нейронной сети глубокого обучения, а именно после после позвоночника и шеи, головка обнаружения обрабатывает высокоуровневые обрабатывает высокоуровневые карты признаков, чтобы получить конечный результат: класс класс объекта и его точное местоположение на изображении. В то время как предыдущие слои сети сосредоточены на извлечении признаков извлечению признаков - выявлению краев, текстур и сложных узоров - головка обнаружения интерпретирует эти данные, чтобы ответить на вопросы "Что это?" и "Где это?".

Функциональность и архитектура

Основная обязанность головки обнаружения - выполнять две разные, но одновременные задачи: классификацию и регрессия. В современных архитектурах обнаружения объектов, эти задачи часто решаются отдельными ветвями внутри головки, что позволяет модели специализироваться на различных аспектах прогнозирования.

  • Ветвь классификации: Этот подкомпонент присваивает балл вероятности различным категориям (например, "человек", "велосипед", "светофор"). Она использует функцию потерь, такую как Cross-Entropy Loss, чтобы узнать различия между классами.
  • Регрессионная ветвь: Эта часть головы предсказывает пространственные координаты пространственных координат, охватывающих объект. Она уточняет размеры блока (x, y, ширину, высоту), чтобы они точно соответствовали истинным, часто минимизируя Потери от пересечения над объединением (IoU).

На выходе из головки обнаружения обычно получается плотный набор кандидатов на обнаружение. Для окончательной обработки результатов постобработка, например Немаксимальное подавление (NMS) чтобы отфильтровать перекрывающиеся блоки и сохранить только наиболее достоверные прогнозы.

Типы детекторных головок

Конструкция головки обнаружения диктует, как модель подходит к проблеме локализации объектов.

  • Головы, основанные на якорях: Традиционные одноступенчатые детекторы объектов, такие как ранние YOLO , полагаются на предопределенные якорные ящики. Головка головка предсказывает смещения от этих фиксированных опорных точек. Несмотря на свою эффективность, этот подход требует тщательной настройки гиперпараметров якоря.
  • Безъякорные головки: Самые современные модели, включая Ultralytics YOLO11, используют безъякорные детекторы. Эти головки предсказывают центры и размеры объектов непосредственно по пикселям карты характеристик, не опираясь на заранее установленные ячейки. Это значительно упрощает архитектуру модели и улучшает обобщение для различных форм объектов.

Применение в реальном мире

Эффективность и точность головки обнаружения крайне важны для внедрения искусственного интеллекта (ИИ) в сложных средах.

  1. Медицинская диагностика: В Анализ медицинских изображений, головки обнаружения обучены определять аномалии, такие как опухоли или переломы, на рентгеновских снимках и снимках МРТ. Например, ИИ в здравоохранении опирается на высокоточные головки чтобы уменьшить количество ложноотрицательных результатов, помогая радиологам выявлять заболевания на ранних стадиях.
  2. Аналитика в розничной торговле: Умные магазины используют компьютерное зрение для track товарных запасов и контроля поведения покупателей поведение покупателей. Детекторные головки в ИИ для розничной торговли могут идентифицировать конкретные Определять конкретные товары на полках или detect подозрительное поведение для предотвращения потерь, обрабатывая видеопоток в режиме реального времени.

Обнаружение головы против позвоночника и шеи

Полезно отличать головку обнаружения от других основных компонентов Конволюционной нейронной сети (CNN):

  • Магистраль: Магистраль (например, ResNet или CSPDarknet) отвечает за извлечение необработанных визуальных признаков из входного изображения.
  • Шея: Шея, часто Сеть пирамид характеристик (FPN), смешивает и уточняет эти характеристики для агрегирования контекста в различных масштабах.
  • Головка: Головка обнаружения использует эти уточненные признаки для создания окончательного прогноза класса и координат прогнозы.

Пример реализации

Следующий фрагмент кода Python демонстрирует, как проверить головку обнаружения предварительно обученной модели YOLO11 с помощью the ultralytics пакет. Это помогает пользователям понять структуру конечного слоя, отвечающего за вывод.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Inspect the final detection head layer
# This typically reveals the number of classes (nc) and anchors/outputs
print(model.model.model[-1])

# Run inference to see the head's output in action
results = model("https://ultralytics.com/images/bus.jpg")

Понимание работы детекторной головки необходимо всем, кто хочет оптимизировать оптимизировать работу модели или выполнить сложные задачи таких как трансферное обучение, где головка часто заменяется для обучения модели на новом пользовательском наборе данных. Исследователи постоянно экспериментируют с с новыми конструкциями головок, чтобы улучшить такие показатели, как средняя точность (mAP), расширяя расширяя границы возможностей компьютерного зрения.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас