Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Détecteurs basés sur des ancres

Découvrez comment les détecteurs basés sur des ancres révolutionnent la détection d'objets grâce à une localisation précise, une adaptabilité d'échelle et des applications concrètes.

Les détecteurs à ancres sont une classe fondamentale de modèles de détection d'objets en vision par ordinateur. Ces modèles fonctionnent en utilisant un ensemble prédéfini de boîtes, appelées boîtes d'ancrage, pour identifier et localiser les objets dans une image. Les boîtes d'ancrage sont essentiellement une grille de modèles avec différentes tailles et différents rapports d'aspect qui sont disposés en mosaïque sur l'image. Le modèle prédit comment déplacer et mettre à l'échelle ces ancres pour qu'elles correspondent aux boîtes englobantes réelles des objets, ainsi qu'un score de confiance indiquant la présence d'un objet. Cette approche simplifie le problème de la recherche d'objets en le transformant en une tâche de régression et de classification par rapport à ces ancres fixes.

Les exemples importants d'architectures basées sur des ancres comprennent la famille R-CNN, comme Faster R-CNN, et les premiers détecteurs à étape unique comme SSD (Single Shot MultiBox Detector) et de nombreux modèles YOLO, y compris le très populaire Ultralytics YOLOv5.

Comment fonctionnent les détecteurs à ancrage

L'idée centrale de la détection basée sur des ancres est d'utiliser un ensemble de boîtes de référence prédéfinies comme point de départ. Pendant le processus d'entraînement du modèle, le détecteur apprend à effectuer deux tâches principales pour chaque boîte d'ancrage :

  1. Classification : Déterminer si une boîte d’ancrage contient un objet d’intérêt ou s’il s’agit simplement d’un arrière-plan.
  2. Régression : Calculer les décalages précis (x, y, largeur, hauteur) nécessaires pour ajuster la boîte d'ancrage afin qu'elle englobe étroitement l'objet détecté.

Ces prédictions sont faites par la tête de détection du modèle après le traitement des caractéristiques de l'image extraites par le backbone. Étant donné qu'un seul objet peut être détecté par plusieurs boîtes d'ancrage, une étape de post-traitement appelée Suppression Non Maximale (NMS) est utilisée pour filtrer les détections redondantes et ne conserver que la boîte la mieux adaptée. La performance de ces modèles est souvent évaluée à l'aide de métriques telles que la précision moyenne (mAP) et l'Intersection sur Union (IoU).

Détecteurs basés sur des ancres vs. Détecteurs sans ancres

Ces dernières années, les détecteurs sans ancrage sont apparus comme une alternative populaire. Contrairement aux modèles basés sur des ancres, les approches sans ancres prédisent directement les emplacements et les tailles des objets, souvent en identifiant les points clés (comme les centres ou les coins des objets) ou en prédisant les distances d'un point aux limites de l'objet, éliminant ainsi le besoin de formes d'ancres prédéfinies.

Les principales différences sont les suivantes :

  • Complexité : Les modèles basés sur des ancres nécessitent une conception et un réglage minutieux des paramètres d'ancrage (tailles, rapports, échelles), qui peuvent dépendre de l'ensemble de données. Les modèles sans ancres simplifient la conception de la tête de détection.
  • Flexibilité : Les méthodes sans ancrage peuvent mieux s'adapter aux objets ayant des rapports hauteur/largeur ou des formes inhabituels qui ne sont pas bien représentés par l'ensemble d'ancres fixes.
  • Efficacité : L'élimination des ancres peut réduire le nombre de prédictions que le modèle doit faire, ce qui peut entraîner une inférence plus rapide et un post-traitement plus simple.

Bien que les détecteurs basés sur des ancres comme YOLOv4 aient connu un grand succès, de nombreuses architectures modernes, y compris Ultralytics YOLO11, ont adopté des conceptions sans ancres afin de tirer parti de leurs avantages en termes de simplicité et d'efficacité. Vous pouvez explorer les avantages de la détection sans ancres dans YOLO11 et consulter des comparaisons entre différents modèles YOLO.

Applications concrètes

Les détecteurs à ancres sont largement utilisés dans diverses applications où les objets ont des formes et des tailles relativement standard.

  • Conduite autonome : Dans les solutions pour l'industrie automobile, ces détecteurs sont excellents pour identifier les véhicules, les piétons et les panneaux de signalisation. Les formes prévisibles de ces objets s'alignent bien avec les ancres prédéfinies, ce qui permet une détection fiable pour des entreprises comme NVIDIA et Tesla.
  • Analyse de vente au détail : Pour la gestion des stocks basée sur l'IA, les modèles basés sur des ancres peuvent scanner efficacement les étagères pour compter les produits. La taille et la forme uniformes des produits emballés en font des candidats idéaux pour cette approche, ce qui contribue à automatiser la surveillance des stocks.
  • Sécurité et surveillance : L'identification de personnes ou de véhicules dans les images de caméras de surveillance fixes est un autre cas d'utilisation important. Ceci est fondamental pour des applications telles que le guide du système d'alarme de sécurité Ultralytics.

Outils et formation

Le développement et le déploiement de modèles de détection d'objets, qu'ils soient basés sur des ancres ou non, impliquent l'utilisation de frameworks tels que PyTorch ou TensorFlow et de bibliothèques comme OpenCV. Des plateformes telles que Ultralytics HUB offrent des flux de travail rationalisés pour l'entraînement de modèles personnalisés, la gestion des ensembles de données et le déploiement de solutions, prenant en charge diverses architectures de modèles. Pour approfondir vos connaissances, des ressources telles que Papers With Code répertorient les modèles de pointe, et des cours de plateformes comme DeepLearning.AI couvrent les concepts fondamentaux.

Rejoignez la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant
Lien copié dans le presse-papiers