Découvrez comment une tête de détection permet la détection d'objets en temps réel. Explorez son rôle dans Ultralytics pour prédire les cadres de sélection et les étiquettes avec une grande précision.
Une tête de détection agit comme la couche décisionnelle finale dans une architecture de réseau neuronal de détection d'objets . Alors que les couches précédentes du modèle sont chargées de comprendre les formes, les textures et les caractéristiques d'une image, la tête de détection est le composant spécifique qui interprète ces informations afin de prédire avec précision quels objets sont présents et où ils se trouvent. Elle transforme les données abstraites de haut niveau produites par l' extracteur de caractéristiques en résultats exploitables, générant généralement un ensemble de rectangles englobant les objets identifiés, ainsi que leurs étiquettes de classe et leurs scores de confiance correspondants.
Pour bien comprendre le fonctionnement d'une tête de détection, il est utile de visualiser les détecteurs modernes comme étant composés de trois étapes principales, chacune ayant un objectif distinct dans le pipeline de vision par ordinateur (CV):
La conception des têtes de détection a considérablement évolué pour améliorer la vitesse et la précision, en particulier avec la transition des méthodes traditionnelles vers les modèles d'inférence en temps réel modernes.
La précision de la tête de détection est essentielle pour déployer l' intelligence artificielle (IA) dans des environnements industriels et critiques pour la sécurité. Les utilisateurs peuvent facilement annoter les données et former ces têtes spécialisées à l'aide de la Ultralytics .
L'exemple suivant montre comment charger un
YOLO26 modèle et inspecte la sortie de sa tête de détection.
Lorsque l'inférence s'exécute, la tête traite l'image et renvoie le résultat final. boxes contenant les coordonnées et les
identifiants de classe.
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")
# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
# Print the bounding box coordinates and the predicted class
print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")
Cette interaction met en évidence la manière dont la tête de détection traduit les activations complexes du réseau neuronal en données lisibles que les développeurs peuvent utiliser pour des tâches en aval telles que le suivi ou le comptage d'objets.