Glossaire

Détecteurs basés sur l'ancrage

Découvre comment les détecteurs basés sur l'ancrage révolutionnent la détection d'objets avec une localisation précise, une adaptabilité à l'échelle et des applications du monde réel.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

Les détecteurs basés sur les ancres représentent une approche importante et fondamentale dans le domaine de la vision par ordinateur (VA) pour s'attaquer à la tâche de détection des objets. Ces modèles fonctionnent en utilisant un ensemble prédéfini de boîtes de référence, communément appelées "ancres" ou "prieurs", qui ont des tailles et des rapports d'aspect spécifiques. Les ancres sont réparties sur l'ensemble de l'image et agissent comme des suppositions initiales ou des modèles, permettant au modèle de prédire plus efficacement l'emplacement et la classe des objets, en particulier lorsqu'il s'agit d'éléments d'échelles et de formes différentes. De nombreux modèles de détection d'objets influents, tels que certaines versions du modèle Ultralytics YOLO ont utilisé cette technique.

Comment fonctionnent les détecteurs à base d'ancre ?

Le concept fondamental des détecteurs basés sur les ancres consiste à superposer une grille dense de ces boîtes d'ancrage prédéfinies sur l'image d'entrée à plusieurs endroits et à plusieurs échelles. Chaque boîte d'ancrage correspond à un objet potentiel d'une taille et d'une forme spécifiques. Au cours du processus d'apprentissage du modèle, le détecteur apprend deux choses essentielles pour chaque ancre : premièrement, il classifie si la boîte d'ancrage contient un objet ou un arrière-plan pertinent ; deuxièmement, il affine la position et les dimensions de l'ancre (un processus appelé régression) pour correspondre précisément à la boîte de délimitation de l'objet réel.

Prenons l'exemple de la détection de divers véhicules dans une image d'une rue très fréquentée. Au lieu d'analyser chaque groupe de pixels, un modèle basé sur les ancres utilise des modèles de boîtes prédéfinis : des plus petits pour les piétons, des carrés moyens pour les voitures et des rectangles plus grands pour les bus. Ces modèles (ancres) sont placés sur l'ensemble de l'image. Si une ancre chevauche de manière significative une voiture, le modèle apprend à la classer comme "voiture" et ajuste les coordonnées et la taille de l'ancre pour qu'elle s'adapte parfaitement à la voiture. Les ancres qui ne couvrent que la route ou les bâtiments sont classées comme "arrière-plan". Cette approche systématique, guidée par des formes prédéfinies, permet de gérer la complexité de la détection des objets. Les performances sont généralement évaluées à l'aide de mesures telles que l'intersection sur l'union (IoU ) et la précision moyenne (mAP).

Principales caractéristiques et avantages

Les détecteurs basés sur l'ancrage, qui s'appuient souvent sur de puissants réseaux neuronaux convolutifs (CNN), offrent des avantages distincts :

  • Gestion des variations d'échelle et de rapport d'aspect : Les ancres prédéfinies couvrent explicitement diverses formes et tailles, ce qui rend ces modèles intrinsèquement bons pour détecter les objets quelles que soient leurs dimensions ou leur orientation.
  • Prédiction structurée : Les ancres fournissent un moyen structuré de générer des propositions d'objets sur l'ensemble de l'image, assurant ainsi une couverture complète.
  • Rappel élevé : En générant un grand nombre d'emplacements d'objets potentiels par le biais des ancres, ces méthodes atteignent souvent un rappel élevé, ce qui signifie qu'elles permettent de trouver les objets les plus pertinents, bien que cela nécessite parfois des étapes de post-traitement telles que la suppression non maximale (NMS) pour filtrer les doublons.
  • Des performances prouvées : Les architectures telles que Faster R-CNN et SSD (Single Shot MultiBox Detector) ont démontré de fortes performances sur des ensembles de données de référence standard tels que COCO.

Applications dans le monde réel

Les détecteurs basés sur les ancres ont été déployés avec succès dans de nombreux scénarios du monde réel :

  1. Véhicules autonomes : La détection des véhicules, des piétons, des cyclistes et des panneaux de signalisation de différentes tailles et distances est essentielle pour une navigation en toute sécurité. Les méthodes basées sur l'ancrage permettent de s'assurer que les objets proches et lointains, grands et petits, sont identifiés de manière fiable. Des entreprises comme Waymo s'appuient fortement sur une détection robuste des objets. Découvre plus en détail l'IA dans les voitures auto-conduites.
  2. Analyse de la vente au détail : Dans les magasins, ces détecteurs peuvent surveiller les rayons pour identifier les produits, vérifier les niveaux de stock ou analyser les schémas de circulation des clients en détectant les personnes. La capacité à gérer différentes tailles et formes d'emballage de produits est essentielle pour des applications telles que la gestion des stocks pilotée par l'IA.

Détecteurs avec ancrage et détecteurs sans ancrage

Ces dernières années, les détecteurs sans ancrage se sont imposés comme une alternative populaire. Contrairement aux modèles basés sur l'ancrage (par ex, Ultralytics YOLOv5), les approches sans ancrage prédisent directement l'emplacement et la taille des objets, souvent en identifiant des points clés (comme les centres ou les coins des objets) ou en prédisant les distances entre un point et les limites de l'objet, ce qui élimine le besoin de formes d'ancrage prédéfinies.

Les principales différences sont les suivantes :

  • Complexité : Les modèles basés sur l'ancrage nécessitent une conception et un réglage minutieux des paramètres de l'ancrage (tailles, rapports, échelles), qui peuvent dépendre de l'ensemble des données. Les modèles sans ancrage simplifient la conception de la tête de détection.
  • Flexibilité : Les méthodes sans ancrage peuvent mieux s'adapter aux objets ayant des rapports d'aspect inhabituels ou des formes qui ne sont pas bien représentées par l'ensemble d'ancrage fixe.
  • Efficacité : L'élimination des ancres peut réduire le nombre de prédictions que le modèle doit faire, ce qui peut conduire à une inférence plus rapide et à un post-traitement plus simple.

Alors que les détecteurs basés sur l'ancrage comme YOLOv4 ont connu un grand succès, de nombreuses architectures modernes, notamment Ultralytics YOLO11ont adopté des conceptions sans ancrage pour tirer parti de leurs avantages en termes de simplicité et d'efficacité. Tu peux explorer les avantages de la détection sans ancre dans YOLO11 et voir des comparaisons entre différents modèles YOLO .

Outils et formation

Le développement et le déploiement de modèles de détection d'objets, qu'ils soient basés sur des ancres ou sans ancres, impliquent l'utilisation de frameworks tels que PyTorch ou TensorFlow et des bibliothèques comme OpenCV. Des plateformes telles qu'Ultralytics HUB proposent des flux de travail rationalisés pour l'entraînement de modèles personnalisés, la gestion des ensembles de données et le déploiement de solutions, en prenant en charge diverses architectures de modèles. Pour un apprentissage plus approfondi, des ressources comme Papers With Code répertorient les modèles de pointe, et les cours de plateformes comme DeepLearning.AI couvrent les concepts fondamentaux.

Tout lire