Boîte de délimitation
Découvrez comment les boîtes englobantes permettent la détection d'objets, l'IA et les systèmes d'apprentissage automatique. Explorez leur rôle dans les applications de vision par ordinateur !
Une boîte de délimitation est un cadre rectangulaire utilisé en vision artificielle (CV) pour indiquer l'emplacement et l'étendue approximative d'un objet dans une image ou une séquence vidéo. Généralement définies par les coordonnées de leurs coins supérieur gauche et inférieur droit (ou point central, largeur et hauteur), ces boîtes constituent une méthode simple mais efficace pour spécifier l'emplacement d'un objet et l'espace qu'il occupe. Les boîtes de délimitation sont des composants fondamentaux dans diverses tâches de CV, notamment la détection et le suivi d'objets, ainsi que l'annotation d'images, et constituent la pierre angulaire de nombreux systèmes modernes d'intelligence artificielle (IA) et d'apprentissage automatique (AAM). Elles sont essentielles pour permettre aux machines de comprendre non seulement quels objets sont présents, mais aussi où ils se trouvent dans une scène visuelle.
Importance dans la détection d'objets
Les boîtes englobantes sont essentielles pour la formation et l'évaluation des modèles de détection d'objets. Dans les tâches traitées par des modèles tels qu'Ultralytics YOLO, les boîtes englobantes servent de "vérité de terrain" au cours du processus de formation. Cela signifie qu'elles représentent l'emplacement et la taille corrects des objets dans les données d'apprentissage, apprenant ainsi au modèle à localiser les objets avec précision. Ce processus commence souvent par une annotation minutieuse des données, où des humains ou des outils automatisés dessinent ces boîtes autour des objets dans les images, en utilisant fréquemment des plateformes comme CVAT ou en s'intégrant à des plateformes comme Ultralytics HUB pour la gestion des ensembles de données. Lors de l'inférence, le modèle entraîné prédit les boîtes englobantes autour des objets détectés, ainsi que les étiquettes de classe et les scores de confiance. Cette capacité de localisation est essentielle pour les applications qui nécessitent non seulement l'identification des objets, mais aussi leur position exacte.
Concepts clés liés aux cadres de délimitation
Plusieurs métriques et techniques sont étroitement associées à l'utilisation et à l'évaluation des boîtes englobantes dans les modèles ML :
- Intersection sur l'Union (IoU): Une métrique utilisée pour mesurer le chevauchement entre la boîte de délimitation prédite et la boîte de délimitation de la vérité de terrain. Elle quantifie la précision de la localisation.
- Suppression non maximale (NMS): Technique de post-traitement utilisée pour éliminer les boîtes de délimitation redondantes et se chevauchant pour un même objet, en ne conservant que la prédiction la plus fiable.
- Précision moyenne (mAP): Une mesure standard pour évaluer la performance des modèles de détection d'objets, prenant en compte à la fois la précision de la classification et la précision de la localisation (souvent basée sur un seuil de l'IoU). Voir les mesures de performance détaillées de YOLO.
- Boîtes d'ancrage: Boîtes prédéfinies de différentes tailles et de différents rapports d'aspect utilisées dans certains détecteurs (comme les anciennes versions de YOLO) pour aider à prédire les boîtes de délimitation de manière plus efficace. Les modèles plus récents, dont YOLO11, sont souvent dépourvus d'ancres, ce qui simplifie la tête de détection.
- Ensemble de données COCO: Un ensemble de données à grande échelle pour la détection d'objets, la segmentation et le sous-titrage, largement utilisé pour évaluer les modèles de détection d'objets. Ultralytics offre un accès facile à COCO et à d'autres ensembles de données de détection.
Boîtes de délimitation et termes apparentés
Alors que les boîtes de délimitation standard (alignées sur les axes) localisent les objets à l'aide de simples rectangles, d'autres techniques de vision par ordinateur offrent différents niveaux de détail ou gèrent différents scénarios :
Applications dans le monde réel
Les boîtes englobantes font partie intégrante de nombreuses applications pratiques de l'intelligence artificielle :
- Véhicules autonomes: Les voitures autonomes s'appuient fortement sur la détection d'objets pour identifier et localiser les piétons, les autres véhicules, les feux de signalisation et les obstacles à l'aide de boîtes englobantes. Cette connaissance de l'espace, souvent obtenue grâce à des modèles d'apprentissage profond, est essentielle pour une navigation et une prise de décision sûres. Des entreprises telles que Waymo font largement appel à cette technologie. Ultralytics offre un aperçu de l'IA dans les voitures auto-conduites.
- Analyse de la vente au détail: Dans le commerce de détail, les boîtes englobantes contribuent à la gestion des stocks pilotée par l'IA en détectant les produits en rayon, en contrôlant les niveaux de stock et en analysant le comportement des clients par le biais de l'interaction avec les rayons ou des schémas de trafic piétonnier(comptage d'objets).
- Sécurité et surveillance: Les boîtes de délimitation permettent aux systèmes de surveillance automatisés de détecter et de suivre des individus ou des objets d'intérêt en temps réel, en déclenchant des alertes en cas d'accès non autorisé ou d'activités suspectes. Cette fonction est fondamentale pour les applications de construction telles que les systèmes d'alarme de sécurité.
- Analyse d'images médicales: Dans le domaine de la santé, les boîtes englobantes aident les radiologues et les cliniciens à mettre en évidence les anomalies potentielles telles que les tumeurs ou les lésions dans les scanners (rayons X, tomodensitométrie, IRM), ce qui permet d'établir un diagnostic plus rapide et plus précis. Voir des exemples dans Radiologie : Intelligence artificielle et Ultralytics sur l'analyse d'images médicales.
- Agriculture: Les boîtes englobantes sont utilisées dans l'agriculture de précision pour des tâches telles que l'identification des fruits à récolter(détection des fruits), la surveillance de la santé des cultures ou la détection des parasites.