Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Boîtes d'ancrage

Découvrez comment les boîtes d'ancrage permettent la détection d'objets basée sur l'ancrage, les antécédents pour la classification, la régression et le NMS, avec des applications dans la conduite autonome et le commerce de détail.

Les boîtes d'ancrage agissent comme des modèles prédéfinis ou des rectangles de référence qui facilitent la détection d'objets dans de nombreux modèles d'apprentissage profond . Au lieu d'entraîner un réseau neuronal à prédire les coordonnées d'un objet à partir de zéro, ce qui peut être instable sur le plan informatique en raison de la grande variance des formes des objets, le modèle place ces boîtes fixes sur l' image et apprend à les ajuster. En traitant la détection comme un problème de régression à partir de ces premières hypothèses, le système peut plus facilement converger vers l'emplacement et la taille corrects du cadre de sélection. Ce concept a fondamentalement changé le paysage de la vision par ordinateur en fournissant un point de départ structuré pour les tâches de localisation.

Le fonctionnement des boîtes d'ancrage

Dans une architecture basée sur des ancres, l'image d'entrée est divisée en une grille. À chaque cellule de cette grille, le modèle génère plusieurs boîtes d'ancrage avec différentes échelles et rapports d'aspect. Par exemple, pour detect objets tels qu'un piéton debout ou un véhicule large, le système peut proposer simultanément une boîte haute et étroite et une boîte courte et large au même endroit. Pendant l'entraînement du modèle, ces ancrages sont comparés aux objets de référence à l'aide d'une métrique appelée Intersection over Union (IoU).

Les ancres qui chevauchent de manière significative un objet réel sont étiquetées comme des échantillons « positifs ». Le réseau apprend ensuite deux tâches principales pour ces ancres positives :

  1. Classification : déterminer la probabilité que l'ancrage contienne une classe d'objets spécifique (par exemple, « chien » ou « vélo ») à l'aide de techniques d'apprentissage supervisé.
  2. Régression : calcul des décalages précis nécessaires pour déplacer et redimensionner l'ancrage afin qu'il encapsule parfaitement l'objet.

Ce processus s'appuie souvent sur des fonctions de perte pour pénaliser les prédictions inexactes, affinant progressivement la capacité du modèle à modifier les modèles.

Détecteurs avec ou sans ancrage

Il est important de faire la distinction entre les approches traditionnelles et les avancées modernes.

  • Détecteurs basés sur des ancres: Modèles hérités tels que le Faster R-CNN original et YOLOv5 s'appuient fortement sur ces boîtes prédéfinies. Bien qu' efficaces, ils nécessitent souvent un réglage manuel des hyperparamètres, tels que la taille et le ratio des ancrages, afin de correspondre au jeu de données spécifique , en utilisant parfois le clustering k-means pour trouver les meilleures formes de boîtes .
  • Détecteurs sans ancrage: Les modèles de pointe, tels que le très recommandé YOLO26, ont évolué vers des architectures sans ancrage ou « centrées ». Ces modèles prédisent directement les centres des objets et les distances par rapport aux limites, éliminant ainsi le besoin de boîtes d'ancrage. Il en résulte une conception plus simple, une inférence plus rapide et une meilleure généralisation, en particulier pour les objets de formes inhabituelles.

Applications concrètes

Bien que l'industrie tende vers des méthodes sans ancrage, les boîtes d'ancrage restent pertinentes dans des domaines spécifiques où les formes des objets sont hautement standardisées.

  • Surveillance du trafic : dans les véhicules autonomes, les systèmes doivent detect et les camions qui ont généralement un rapport d'aspect constant (rectangulaire et horizontal). Les boîtes d'ancrage peuvent être réglées spécifiquement pour ces formes afin d'améliorer la stabilité de la détection sur les autoroutes.
  • Inventaire dans le commerce de détail : dans le domaine du commerce de détail, les systèmes de caisse automatisés detect des produits tels que les boîtes de céréales ou les canettes de soda. Comme ces articles ont des dimensions fixes et connues, les ancres peuvent être préconfigurées pour correspondre aux spécifications des produits, ce qui facilite le comptage précis des objets et minimise les faux positifs.

Gestion des prédictions redondantes

Étant donné qu'un modèle peut générer des milliers de boîtes d'ancrage pour une seule image, beaucoup se chevaucheront sur le même objet. Pour résoudre ce problème, une étape de post-traitement appelée suppression non maximale (NMS) est généralement utilisée. NMS les boîtes en double, ne conservant que celle qui a le score de confiance le plus élevé . Il convient de noter que les derniers modèles YOLO26 sont nativement de bout en bout, ce qui signifie qu'ils produisent directement l'ensemble final d'objets sans avoir besoin NMS, ce qui accélère considérablement le déploiement.

Exemple : détection d'objets

Que le modèle utilise ou non des ancres en interne, le résultat est standard : des boîtes englobantes. Ce qui suit Python Le code montre comment charger un modèle et visualiser ces boîtes à l'aide de la fonction ultralytics l'emballage.

from ultralytics import YOLO

# Load the latest YOLO26 model (natively end-to-end)
model = YOLO("yolo26n.pt")

# Perform inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting bounding boxes
results[0].show()

Pour les équipes qui cherchent à annoter des données et à gérer efficacement les flux de travail de formation, la Ultralytics offre un environnement complet pour traiter les ensembles de données et déployer des modèles sans avoir à gérer une infrastructure complexe.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant