Descubra cómo un cabezal de detección permite la detección de objetos en tiempo real. Explore su función en Ultralytics para predecir cuadros delimitadores y etiquetas con gran precisión.
Un cabezal de detección actúa como la capa final de toma de decisiones en una arquitectura de red neuronal de detección de objetos . Mientras que las capas anteriores del modelo se encargan de comprender las formas, texturas y características de una imagen, el cabezal de detección es el componente específico que interpreta esta información para predecir exactamente qué objetos están presentes y dónde se encuentran. Transforma los datos abstractos de alto nivel producidos por el extractor de características en resultados procesables, generando normalmente un conjunto de cuadros delimitadores que encierran los objetos identificados junto con sus correspondientes etiquetas de clase y puntuaciones de confianza.
Para comprender plenamente la función de un cabezal de detección, resulta útil visualizar los detectores modernos como compuestos por tres etapas principales, cada una de las cuales cumple una función distinta en el proceso de visión por ordenador (CV):
El diseño de los cabezales de detección ha evolucionado significativamente para mejorar la velocidad y la precisión, sobre todo con la transición de los métodos tradicionales a los modernos modelos de inferencia en tiempo real.
La precisión del cabezal de detección es fundamental para implementar la inteligencia artificial (IA) en entornos industriales y críticos para la seguridad. Los usuarios pueden anotar fácilmente los datos y entrenar estos cabezales especializados utilizando la Ultralytics .
El siguiente ejemplo muestra cómo cargar un
YOLO26 modelar e inspeccionar la salida de su cabezal de detección.
Cuando se ejecuta la inferencia, el cabezal procesa la imagen y devuelve el resultado final. boxes que contiene coordenadas e
identificadores de clase.
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")
# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
# Print the bounding box coordinates and the predicted class
print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")
Esta interacción destaca cómo el cabezal de detección traduce las activaciones complejas de la red neuronal en datos legibles que los desarrolladores pueden utilizar para tareas posteriores, como el seguimiento o el recuento de objetos.