Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024
Glossaire

Tête de détection

Découvrez le rôle essentiel des têtes de détection dans la détection d'objets, en affinant les cartes de caractéristiques pour identifier avec précision les emplacements et les classes d'objets.

Une tête de détection est un composant essentiel dans les architectures de détection d'objets qui est responsable de la réalisation des prédictions finales sur la présence, l'emplacement et la classe des objets dans une image ou une vidéo. Positionnée à la fin d'un réseau neuronal, elle prend les cartes de caractéristiques traitées générées par le backbone et le neck du modèle, et les traduit en sorties tangibles. Plus précisément, la tête de détection effectue deux tâches principales : elle classe les objets potentiels dans des catégories prédéfinies (par exemple, "voiture", "personne", "chien") et effectue une régression pour prédire les coordonnées exactes de la boîte englobante qui entoure chaque objet détecté.

Comment fonctionnent les têtes de détection ?

Dans un réseau neuronal convolutif (CNN) typique utilisé pour la détection d'objets, l'image d'entrée passe par une série de couches. Les couches initiales (le backbone) extraient les caractéristiques de bas niveau comme les bords et les textures, tandis que les couches plus profondes capturent des motifs plus complexes. La tête de détection est l'étape finale qui synthétise ces caractéristiques de haut niveau pour produire la sortie souhaitée.

La conception de la tête de détection est un différenciateur clé entre les différents modèles de détection d'objets. Certaines têtes sont conçues pour la vitesse, ce qui les rend adaptées à l'inférence en temps réel sur les appareils périphériques, tandis que d'autres sont optimisées pour une précision maximale. La performance d'un modèle de détection, souvent mesurée par des métriques comme la précision moyenne (mAP), est fortement influencée par l'efficacité de sa tête de détection. Vous pouvez explorer les comparaisons de modèles pour voir comment différentes architectures fonctionnent.

Têtes de détection dans les architectures modernes

L'apprentissage profond moderne a connu une évolution significative dans la conception des têtes de détection. La distinction entre les détecteurs basés sur des ancres et les détecteurs sans ancres est particulièrement importante.

  • Heads basés sur des ancres : Ces heads traditionnels utilisent un ensemble de boîtes prédéfinies (ancres) de différentes tailles et rapports d'aspect. Le head prédit comment déplacer et mettre à l'échelle ces ancres pour qu'elles correspondent aux objets de vérité terrain dans l'image.
  • Heads sans ancres : Les modèles plus récents, y compris Ultralytics YOLO11, utilisent souvent des heads sans ancres. Ces heads prédisent directement les emplacements des objets, par exemple en identifiant des points clés comme le centre d'un objet. Cette approche peut simplifier la conception du modèle et améliorer la flexibilité pour les objets de formes inhabituelles, comme expliqué en détail dans ce blog sur les avantages de l'absence d'ancres de YOLO11.

Le développement de ces composants repose sur des frameworks puissants comme PyTorch et TensorFlow, qui fournissent les outils nécessaires pour construire et entraîner des modèles personnalisés. Des plateformes comme Ultralytics HUB rationalisent davantage ce processus.

Applications concrètes

L'efficacité du module de détection influence directement les performances de nombreuses applications d'IA basées sur la détection d'objets.

  1. Véhicules autonomes : Dans les voitures autonomes, les têtes de détection sont essentielles pour identifier et localiser en temps réel les piétons, les autres véhicules et les panneaux de signalisation. La vitesse et la précision de ces prédictions sont essentielles pour une navigation sûre, une technologie largement utilisée par des entreprises comme Waymo. Cela nécessite des têtes de détection robustes capables de gérer des environnements divers et dynamiques.
  2. Sécurité et Surveillance : Les têtes de détection alimentent les systèmes de surveillance automatisés en identifiant les personnes non autorisées, les objets abandonnés ou les événements spécifiques dans les flux vidéo. Cette capacité est fondamentale pour des applications telles que le guide du système d'alarme de sécurité Ultralytics.
  3. Analyse d'images médicales : Les têtes de détection aident les radiologues en localisant précisément les anomalies telles que les tumeurs ou les fractures dans les images médicales, contribuant à des diagnostics plus rapides et plus précis. Vous pouvez en apprendre davantage sur cette application en lisant sur l'utilisation de YOLO11 pour la détection de tumeurs.
  4. Industrie manufacturière : Dans les usines, les têtes de détection permettent un contrôle qualité automatisé dans l'industrie manufacturière en repérant les défauts des produits sur les chaînes de montage.
  5. Analyse de vente au détail : Ces composants sont utilisés pour des applications telles que la gestion des stocks et l'analyse des schémas de fréquentation des clients.

Les têtes de détection sophistiquées dans des modèles comme YOLOv8 sont entraînées sur des ensembles de données de référence à grande échelle tels que COCO pour garantir des performances élevées dans un large éventail de tâches et de scénarios. La sortie finale est souvent affinée à l'aide de techniques telles que la suppression non maximale (NMS) pour filtrer les détections redondantes. Pour des connaissances plus approfondies, les cours en ligne de fournisseurs comme Coursera et DeepLearning.AI offrent des parcours d'apprentissage complets.

Rejoignez la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant
Lien copié dans le presse-papiers