Découvrez comment les détecteurs basés sur des ancres révolutionnent la détection d'objets grâce à une localisation précise, une adaptabilité d'échelle et des applications concrètes.
Les détecteurs à ancres sont une classe fondamentale de modèles de détection d'objets en vision par ordinateur. Ces modèles fonctionnent en utilisant un ensemble prédéfini de boîtes, appelées boîtes d'ancrage, pour identifier et localiser les objets dans une image. Les boîtes d'ancrage sont essentiellement une grille de modèles avec différentes tailles et différents rapports d'aspect qui sont disposés en mosaïque sur l'image. Le modèle prédit comment déplacer et mettre à l'échelle ces ancres pour qu'elles correspondent aux boîtes englobantes réelles des objets, ainsi qu'un score de confiance indiquant la présence d'un objet. Cette approche simplifie le problème de la recherche d'objets en le transformant en une tâche de régression et de classification par rapport à ces ancres fixes.
Les exemples importants d'architectures basées sur des ancres comprennent la famille R-CNN, comme Faster R-CNN, et les premiers détecteurs à étape unique comme SSD (Single Shot MultiBox Detector) et de nombreux modèles YOLO, y compris le très populaire Ultralytics YOLOv5.
L'idée centrale de la détection basée sur des ancres est d'utiliser un ensemble de boîtes de référence prédéfinies comme point de départ. Pendant le processus d'entraînement du modèle, le détecteur apprend à effectuer deux tâches principales pour chaque boîte d'ancrage :
Ces prédictions sont faites par la tête de détection du modèle après le traitement des caractéristiques de l'image extraites par le backbone. Étant donné qu'un seul objet peut être détecté par plusieurs boîtes d'ancrage, une étape de post-traitement appelée Suppression Non Maximale (NMS) est utilisée pour filtrer les détections redondantes et ne conserver que la boîte la mieux adaptée. La performance de ces modèles est souvent évaluée à l'aide de métriques telles que la précision moyenne (mAP) et l'Intersection sur Union (IoU).
Ces dernières années, les détecteurs sans ancrage sont apparus comme une alternative populaire. Contrairement aux modèles basés sur des ancres, les approches sans ancres prédisent directement les emplacements et les tailles des objets, souvent en identifiant les points clés (comme les centres ou les coins des objets) ou en prédisant les distances d'un point aux limites de l'objet, éliminant ainsi le besoin de formes d'ancres prédéfinies.
Les principales différences sont les suivantes :
Bien que les détecteurs basés sur des ancres comme YOLOv4 aient connu un grand succès, de nombreuses architectures modernes, y compris Ultralytics YOLO11, ont adopté des conceptions sans ancres afin de tirer parti de leurs avantages en termes de simplicité et d'efficacité. Vous pouvez explorer les avantages de la détection sans ancres dans YOLO11 et consulter des comparaisons entre différents modèles YOLO.
Les détecteurs à ancres sont largement utilisés dans diverses applications où les objets ont des formes et des tailles relativement standard.
Le développement et le déploiement de modèles de détection d'objets, qu'ils soient basés sur des ancres ou non, impliquent l'utilisation de frameworks tels que PyTorch ou TensorFlow et de bibliothèques comme OpenCV. Des plateformes telles que Ultralytics HUB offrent des flux de travail rationalisés pour l'entraînement de modèles personnalisés, la gestion des ensembles de données et le déploiement de solutions, prenant en charge diverses architectures de modèles. Pour approfondir vos connaissances, des ressources telles que Papers With Code répertorient les modèles de pointe, et des cours de plateformes comme DeepLearning.AI couvrent les concepts fondamentaux.