Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Tête de détection

Découvrez comment une tête de détection permet la détection d'objets en temps réel. Explorez son rôle dans Ultralytics pour prédire les cadres de sélection et les étiquettes avec une grande précision.

Une tête de détection agit comme la couche décisionnelle finale dans une architecture de réseau neuronal de détection d'objets . Alors que les couches précédentes du modèle sont chargées de comprendre les formes, les textures et les caractéristiques d'une image, la tête de détection est le composant spécifique qui interprète ces informations afin de prédire avec précision quels objets sont présents et où ils se trouvent. Elle transforme les données abstraites de haut niveau produites par l' extracteur de caractéristiques en résultats exploitables, générant généralement un ensemble de rectangles englobant les objets identifiés, ainsi que leurs étiquettes de classe et leurs scores de confiance correspondants.

Distinguer la tête de la colonne vertébrale et du cou

Pour bien comprendre le fonctionnement d'une tête de détection, il est utile de visualiser les détecteurs modernes comme étant composés de trois étapes principales, chacune ayant un objectif distinct dans le pipeline de vision par ordinateur (CV):

  • Backbone : Il s'agit de la partie initiale du réseau, souvent un réseau neuronal convolutif (CNN) tel que ResNet ou CSPNet. Il traite l'image brute en entrée pour créer des cartes de caractéristiques qui représentent des modèles visuels.
  • Cou : Situé entre la colonne vertébrale et la tête, le cou affine et combine les caractéristiques de différentes échelles. Des architectures telles que le réseau pyramidal des caractéristiques (FPN) garantissent que le modèle peut detect de tailles variables en agrégeant le contexte.
  • Tête : composante finale qui utilise les caractéristiques affinées provenant du cou. Elle effectue la tâche réelle de classification (qu'est-ce que c'est ?) et de régression (où est-ce ?).

Évolution : basée sur des ancres ou sans ancres

La conception des têtes de détection a considérablement évolué pour améliorer la vitesse et la précision, en particulier avec la transition des méthodes traditionnelles vers les modèles d'inférence en temps réel modernes.

Applications concrètes

La précision de la tête de détection est essentielle pour déployer l' intelligence artificielle (IA) dans des environnements industriels et critiques pour la sécurité. Les utilisateurs peuvent facilement annoter les données et former ces têtes spécialisées à l'aide de la Ultralytics .

  • Conduite autonome : dans le domaine de l' IA appliquée à l'automobile, la tête de détection est chargée de distinguer en temps réel les piétons, les feux de signalisation et les autres véhicules. Une tête hautement optimisée garantit que la latence d'inférence reste suffisamment faible pour que le véhicule puisse réagir instantanément.
  • Diagnostic médical : dans le domaine de l'analyse d'images médicales, les têtes de détection sont réglées avec précision pour localiser des anomalies telles que des tumeurs dans les IRM. La branche de régression doit être extrêmement précise pour délimiter exactement les contours d'une lésion, afin d'aider les médecins dans leurs solutions de soins de santé.

Exemple de code

L'exemple suivant montre comment charger un YOLO26 modèle et inspecte la sortie de sa tête de détection. Lorsque l'inférence s'exécute, la tête traite l'image et renvoie le résultat final. boxes contenant les coordonnées et les identifiants de classe.

from ultralytics import YOLO

# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")

# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")

# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
    # Print the bounding box coordinates and the predicted class
    print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")

Cette interaction met en évidence la manière dont la tête de détection traduit les activations complexes du réseau neuronal en données lisibles que les développeurs peuvent utiliser pour des tâches en aval telles que le suivi ou le comptage d'objets.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant