Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024
Glossaire

Boîtes d'ancrage

Découvrez comment les boîtes d'ancrage permettent la détection d'objets basée sur l'ancrage, les antécédents pour la classification, la régression et le NMS, avec des applications dans la conduite autonome et le commerce de détail.

Les boîtes d'ancrage sont un élément fondamental de nombreux modèles de détection d'objets basés sur l'ancrage, servant d'ensemble prédéfini de boîtes de référence avec des hauteurs et des largeurs spécifiques. Ces boîtes servent d'antécédents, ou de suppositions éclairées, sur l'emplacement et l'échelle potentiels des objets dans une image. Au lieu de rechercher des objets à l'aveugle, les modèles utilisent ces points d'ancrage comme points de départ, prédisant des décalages pour affiner leur position et leur taille afin de les faire correspondre aux objets réels. Cette approche transforme la tâche complexe de localisation d'objets en un problème de régression plus facile à gérer, où le modèle apprend à ajuster ces modèles plutôt que de générer des boîtes à partir de zéro.

Fonctionnement des boîtes d'ancrage

Le mécanisme de base consiste à recouvrir une image d'une grille dense de boîtes d'ancrage à différentes positions. À chaque position, des ancres multiples avec des échelles et des rapports d'aspect différents sont utilisées pour s'assurer que des objets de formes et de tailles diverses peuvent être détectés efficacement. Au cours du processus d'apprentissage du modèle, l'épine dorsale du détecteur extrait d'abord une carte de caractéristiques de l'image d'entrée. La tête de détection utilise ensuite ces caractéristiques pour effectuer deux tâches pour chaque boîte d'ancrage :

  • Classification: Elle prédit la probabilité qu'une boîte d'ancrage contienne un objet d'intérêt, en attribuant une étiquette de classe et un score de confiance.
  • Régression: Elle calcule les ajustements précis (ou décalages) nécessaires pour transformer la boîte d'ancrage en une boîte d'encerclement finale qui entoure étroitement l'objet.

Le modèle utilise des mesures telles que l'intersection sur l'union (IoU) pour déterminer les boîtes d'ancrage qui correspondent le mieux aux objets de référence au cours de l'apprentissage. Après la prédiction, une étape de post-traitement appelée Suppression non maximale (NMS) est appliquée pour éliminer les boîtes redondantes et se chevauchant pour le même objet.

Boîtes d'ancrage et autres concepts

Il est important de distinguer les boîtes d'ancrage des termes apparentés dans le domaine de la vision par ordinateur :

  • Boîte de délimitation: Une boîte d'ancrage est un modèle prédéfini utilisé au cours du processus de détection, tandis qu'une boîte de délimitation est le résultat final, affiné, qui localise précisément un objet détecté.
  • Détecteurs sans ancrage: Alors que les modèles basés sur l'ancrage comme YOLOv5 et la famille Faster R-CNN s'appuient sur ces préréglages, les architectures modernes s'orientent de plus en plus vers des détecteurs sans ancrage. Des modèles comme Ultralytics YOLO11 prédisent l'emplacement des objets directement en identifiant les points clés ou les centres, ce qui simplifie la conception du modèle et peut améliorer les performances sur des objets aux formes non conventionnelles. Vous pouvez en savoir plus sur les avantages d'une conception sans ancrage dans YOLO11.

Applications concrètes

L'approche structurée des boîtes d'ancrage les rend efficaces dans les scénarios où les objets ont des formes et des tailles prévisibles.

  1. Conduite autonome: Dans les solutions destinées à l'industrie automobile, les détecteurs à ancrage excellent dans l'identification des voitures, des piétons et des panneaux de signalisation. Les rapports d'aspect relativement constants de ces objets s'alignent bien sur les ancres prédéfinies, ce qui permet une détection fiable pour les systèmes développés par des sociétés telles que NVIDIA et Tesla.
  2. Analyse de la vente au détail: Pour la gestion des stocks pilotée par l'IA, ces modèles peuvent scanner efficacement les étagères pour compter les produits. La taille et la forme uniformes des produits emballés en font des candidats idéaux pour une approche basée sur l'ancrage, ce qui permet d'automatiser le suivi des stocks et de réduire les efforts manuels.

Ces modèles sont généralement développés à l'aide de puissants cadres d'apprentissage profond tels que PyTorch et TensorFlow. Pour un apprentissage continu, des plateformes comme DeepLearning.AI proposent des cours complets sur les fondamentaux de la vision par ordinateur.

Rejoignez la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant
Lien copié dans le presse-papiers