Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Cabezal de Detección

Descubra el papel fundamental de los cabezales de detección en la detección de objetos, refinando los mapas de características para identificar con precisión las ubicaciones y clases de los objetos.

Un cabezal de detección es el componente final, y quizás el más crítico, de un modelo de detección de objetos, y sirve como la capa de toma de decisiones que traduce las características codificadas de la imagen en predicciones procesables. capa de toma de decisiones que traduce las características codificadas de la imagen en predicciones procesables. Se encuentra al final de una red neuronal de de una red neuronal de aprendizaje profundo la columna vertebral y el cuello, la cabeza de detección procesa de alto nivel para producir el resultado final: la clase de objeto y su ubicación precisa en la imagen. Mientras que las primeras capas de la red se centran en la extracción de características características -identificar bordes, texturas y patrones complejos-, la cabeza de detección interpreta estos datos para responder a las preguntas "¿qué es? "¿qué es?" y "¿dónde está?".

Funcionalidad y arquitectura

La principal responsabilidad de un cabezal de detección es realizar dos tareas distintas pero simultáneas: clasificación y regresión. En las arquitecturas de detección de objetos estas tareas suelen estar a cargo de ramas separadas dentro del cabezal, una elección de diseño que permite al modelo especializarse en distintos aspectos de la predicción.

  • Rama de clasificación: Este subcomponente asigna una puntuación de probabilidad a varias categorías (p. ej, "persona", "bicicleta", "semáforo"). Utiliza una función de pérdida función de pérdida, como la pérdida de entropía cruzada, para aprender la diferencia entre las clases.
  • Rama de regresión: Esta parte de la cabeza predice las coordenadas espaciales de la que rodea al objeto. Refina las dimensiones las dimensiones de la caja (x, y, anchura, altura) para alinearlas con la verdad sobre el terreno, a menudo minimizando la pérdida de intersección sobre unión (IoU). Pérdida de intersección sobre unión (IoU ).

La salida del cabezal de detección suele ser un conjunto denso de detecciones candidatas. Para finalizar los resultados pasos de posprocesamiento como supresión no máxima (NMS) para filtrar para filtrar las cajas que se solapan y retener sólo las predicciones más fiables.

Tipos de cabezas de detección

El diseño del cabezal de detección determina la forma en que un modelo aborda el problema de la localización de objetos.

  • Cabezas basadas en anclajes: Tradicional detectores de objetos de una etapa YOLO se basan en cajas de anclaje predefinidas. El cabezal cabeza predice los desplazamientos desde estas cajas de referencia fijas. Aunque eficaz, este enfoque requiere un ajuste cuidadoso de los hiperparámetros de anclaje. hiperparámetros de anclaje.
  • Cabezas sin anclaje: Modelos de última generación, incluyendo Ultralytics YOLO11utilizan detectores sin anclaje. Estos cabezales predicen los centros y tamaños de los objetos directamente a partir de los píxeles del mapa de características, sin depender de recuadros preestablecidos. Esto simplifica Esto simplifica significativamente la arquitectura del modelo y mejora la generalización a través de diferentes formas de objetos.

Aplicaciones en el mundo real

La eficacia y precisión del cabezal de detección son vitales para desplegar inteligencia artificial (IA) en entornos complejos.

  1. Diagnóstico médico: En análisis de imágenes médicas, los cabezales de detección están capacitados para detectar anomalías como tumores o fracturas en radiografías y resonancias magnéticas. Por ejemplo, la IA en sanidad se basa en cabezales de alta precisión para reducir los falsos negativos y ayudar a los radiólogos en la detección precoz de enfermedades.
  2. Análisis del comercio minorista: Las tiendas inteligentes utilizan la visión por ordenador para track el inventario y supervisar el comportamiento de los clientes. comportamiento de los clientes. Los cabezales de detección en IA para aplicaciones minoristas pueden identificar productos específicos en las estanterías o detect comportamientos sospechosos para la prevención de pérdidas, procesando imágenes de vídeo en tiempo real.

Detección Cabeza vs. Espina dorsal y cuello

Resulta útil distinguir el cabezal de detección de los demás componentes principales de una red neuronal convolucional (CNN):

  • Red troncal: La red troncal (por ejemplo, ResNet o CSPDarknet) se encarga de extraer las características visuales brutas de la imagen de entrada.
  • Cuello: El cuello, a menudo una red piramidal de características (FPN), mezcla y refina estas características para agregar contexto a diferentes escalas.
  • Cabezal: El cabezal de detección consume estas características refinadas para generar las predicciones finales de clase y coordenadas. finales.

Ejemplo de aplicación

El siguiente fragmento de código Python demuestra cómo inspeccionar la cabeza de detección de un modelo YOLO11 preentrenado utilizando la herramienta ultralytics paquete. Esto ayuda a los usuarios a comprender la estructura de la capa final responsable de la inferencia.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Inspect the final detection head layer
# This typically reveals the number of classes (nc) and anchors/outputs
print(model.model.model[-1])

# Run inference to see the head's output in action
results = model("https://ultralytics.com/images/bus.jpg")

Comprender el cabezal de detección es esencial para cualquiera que desee optimizar el rendimiento del modelo o realizar tareas avanzadas. rendimiento del modelo o realizar tareas avanzadas como el aprendizaje por transferencia, en el que a menudo se sustituye el cabezal para entrenar el modelo en un nuevo nuevo conjunto de datos personalizado. Los investigadores experimentan continuamente con nuevos diseños de cabezales para mejorar métricas como como la precisión media (mAP), ampliando los límites de lo que puede lograr la visión por ordenador.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora