Découvrez comment les détecteurs basés sur des ancres utilisent des cadres de sélection prédéfinis pour la détection d'objets. Apprenez leurs mécanismes fondamentaux, leurs cas d'utilisation concrets et comparez-les au système moderne et plus rapide Ultralytics .
Les détecteurs basés sur des ancrages constituent une catégorie fondamentale de modèles de détection d'objets en vision par ordinateur qui utilisent un ensemble de cadres de sélection prédéfinis pour localiser et classify . Au lieu d'essayer de prédire les coordonnées d'un objet à partir d'une page blanche, ces systèmes commencent par des modèles de référence fixes appelés cadres d'ancrage. Le réseau neuronal est ensuite entraîné à déterminer lequel de ces modèles correspond le mieux à un objet dans l'image et à calculer les décalages spécifiques (ajustements de position et de taille) nécessaires pour aligner parfaitement l'ancrage avec la cible. Cette approche transforme le problème difficile de la prédiction arbitraire des coordonnées en une tâche de régression plus stable, ce qui a constitué une avancée majeure dans le développement des premières architectures d'apprentissage profond (DL) telles que Faster R-CNN et SSD.
Le fonctionnement de base d'un détecteur basé sur des ancres consiste à diviser l'image d'entrée en une grille dense. À chaque cellule de cette grille, le modèle génère plusieurs boîtes d'ancrage avec différentes échelles et proportions afin de prendre en compte différentes formes d'objets, tels que des piétons de grande taille ou des véhicules larges. Lorsque les données d'image passent par la colonne vertébrale du modèle, le réseau extrait des caractéristiques riches afin d'effectuer deux tâches simultanées :
x, y coordonnées, largeur et hauteur, ce qui donne un résultat compact.
boîte englobante.
Pendant l'entraînement du modèle, ces détecteurs utilisent une métrique appelée Intersection over Union (IoU) pour faire correspondre les ancres prédéfinies avec les étiquettes de vérité terrain fournies dans l'ensemble de données. Les ancres présentant un chevauchement élevé sont traitées comme des échantillons positifs. Étant donné que ce processus génère des milliers de détections potentielles, un algorithme de filtrage appelé Non-Maximum Suppression (NMS) est appliqué pendant l'inférence afin d'éliminer les boîtes redondantes et de ne conserver que la prédiction la plus précise pour chaque objet.
Alors que les méthodes basées sur des ancres ont établi la norme pendant des années, le domaine a évolué vers des détecteurs sans ancres. Comprendre la distinction est vital pour les praticiens modernes.
La logique basée sur les ancrages reste pertinente dans de nombreux systèmes de production hérités et spécialisés où les formes des objets sont prévisibles et cohérentes.
Alors que les derniers modèles YOLO26 utilisent des têtes sans ancrage pour des performances supérieures, l'interface pour la détection reste cohérente. Ultralytics et Python masquent la complexité liée à l'utilisation d'ancrages ou de points centraux par un modèle, permettant ainsi aux utilisateurs de se concentrer sur les résultats.
Voici comment charger un modèle et exécuter une inférence pour detect , un workflow qui s'applique quelle que soit l'architecture d'ancrage sous-jacente :
from ultralytics import YOLO
# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")
# Run inference on an image source
# The model handles internal logic (anchor-based or anchor-free) automatically
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the first result with bounding boxes
results[0].show()
Pour approfondir votre compréhension des mécanismes de détection, explorez les recherches fondamentales sur Faster R-CNN qui a introduit le Region Proposal Network (RPN), ou lisez des articles sur le Single Shot MultiBox Detector (SSD), qui a optimisé la détection basée sur les ancres pour plus de rapidité. Pour une vision plus large du domaine, l' COCO sert de référence standard pour évaluer à la fois les modèles basés sur des ancrages et ceux sans ancrages. De plus, les cours avancés sur Coursera couvrent souvent les détails mathématiques de la régression des boîtes et de la correspondance des ancrages.