Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Qu'est-ce que la détection de boîtes englobantes orientées (OBB) ?

5 min de lecture

9 juin 2025

Découvrez comment la détection de boîtes englobantes orientées (OBB) améliore la détection d'objets en identifiant précisément les objets pivotés dans les images à travers des applications du monde réel.

Reconnaître des objets, quelle que soit leur disposition ou leur orientation, est naturel pour nous, en tant qu'humains. Qu'il s'agisse de voitures à une intersection ou de bateaux dans un port, nous pouvons facilement dire ce qu'ils sont et dans quelle direction ils pointent. Cependant, pour les systèmes d'intelligence artificielle (IA), ce n'est pas si simple.

Par exemple, la vision par ordinateur, une branche de l'IA axée sur la compréhension des images et des vidéos, permet des tâches telles que la détection d'objets, qui aide les machines à identifier et à localiser les objets dans une scène. La détection d'objets traditionnelle repose sur des boîtes englobantes alignées sur les axes pour dessiner des boîtes autour des objets. Ces boîtes ont des côtés droits et des angles droits fixes. Cette approche fonctionne bien lorsque les objets sont droits et pas trop proches les uns des autres. 

Mais lorsque les objets sont inclinés, pivotés ou rapprochés, la détection d'objets traditionnelle a souvent du mal à les capturer avec précision. Pour gérer ces situations plus complexes, des techniques telles que la détection de boîtes englobantes orientées (OBB) ont été introduites. Contrairement aux boîtes englobantes standard, les OBB peuvent pivoter pour correspondre à l'angle et à la forme de l'objet, ce qui permet un ajustement plus précis.

Modèles de vision par ordinateur comme Ultralytics YOLO11qui prennent en charge la détection des OBB, permettent une série d'applications en temps réel, en particulier dans les scénarios où l'orientation des objets est importante, comme la surveillance aérienne. En outre, la détection des OBB est également utilisée dans les domaines de la santé, de l'agriculture et de l'analyse de documents.

Dans cet article, nous explorerons ce qu'est la détection OBB, comment elle fonctionne et où elle est appliquée dans des scénarios réels. Commençons !

__wf_reserved_inherit
Fig. 1. Exemple de démonstration de l'utilisation de YOLO11 pour la détection d'OBB sur les bateaux.

Qu'est-ce qu'une boîte englobante orientée (oriented bounding box) ?

Un rectangle englobant orienté est un type de rectangle utilisé en vision par ordinateur pour représenter les objets détectés dans une image. Alors que les rectangles englobants standard sont alignés sur les axes horizontal et vertical de l'image, les OBB peuvent pivoter pour correspondre à l'angle réel de l'objet.

Cette capacité de rotation apporte plusieurs avantages. Les OBB peuvent s'aligner plus étroitement sur l'orientation d'un objet, ce qui permet à la boîte de s'adapter étroitement à la forme et à la direction de l'objet. Par conséquent, la détection devient plus précise et exacte.

Les OBB sont particulièrement utiles lorsque les objets ne sont pas parfaitement droits, comme une voiture qui tourne sur une route sinueuse dans des images aériennes, un livre incliné sur un bureau ou une tumeur pivotée dans un scan médical. En faisant correspondre plus précisément l'angle d'un objet, les OBB améliorent les performances de détection, réduisent les interférences de l'arrière-plan et sont particulièrement intéressantes pour les applications où l'orientation d'un objet est aussi importante que sa position.

__wf_reserved_inherit
Fig. 2. Comparaison de la détection d'objets et de la détection OBB.

Détection OBB vs. détection d'objets

La détection OBB et la détection d'objets traditionnelle peuvent sembler similaires au premier abord, mais elles sont utilisées de différentes manières et dans différentes situations. Examinons de plus près comment elles se comparent avec un exemple.

Les modèles de vision par ordinateur, comme YOLO11, peuvent être entraînés à detect et à classify objets dans diverses applications du monde réel, telles que l'inspection industrielle. Prenons l'exemple d'une chaîne d'assemblage où différentes pièces de machines se déplacent le long d'un tapis roulant. Certaines pièces peuvent être bien placées, mais d'autres peuvent être légèrement tournées, inclinées ou se chevaucher en raison des vibrations ou de la vitesse.

La détection d'objets traditionnelle utilise des boîtes rectangulaires verticales qui s'alignent sur les bords horizontaux et verticaux de l'image. Ainsi, lorsqu'une pièce est pivotée, la boîte peut ne pas s'adapter correctement - elle pourrait omettre une partie de l'objet ou inclure trop d'arrière-plan. Cela peut rendre les détections moins précises et plus difficiles pour le système à identifier la pièce avec confiance.

Maintenant, disons que vous utilisez plutôt la détection OBB. Dans ce cas, le modèle peut tracer une boîte qui pivote pour correspondre à l'angle exact de chaque pièce. Un engrenage incliné ou un composant angulaire sera étroitement enfermé par une boîte qui correspond à sa forme et à sa direction. Cela signifie une meilleure précision, moins d'erreurs et des résultats plus fiables, en particulier en ce qui concerne les cas d'utilisation tels que le contrôle qualité automatisé ou le tri robotisé.

Modèles populaires de détection OBB

Maintenant que nous avons une meilleure compréhension de ce qu'est la détection OBB, examinons certains des modèles d'IA de vision les plus largement utilisés qui la prennent en charge.

Plusieurs modèles avancés de vision par ordinateur ont été développés spécifiquement pour la détection d'objets tournés ou inclinés. Parmi eux, les modèles Ultralytics YOLO sont particulièrement connus pour leurs capacités de détection fiable et efficace des OBB.

Les versions antérieures comme Ultralytics YOLOv5 étaient conçues pour la détection d'objets standard. Les versions ultérieures, telles que Ultralytics YOLOv8 et la plus récente YOLO11, ont introduit la prise en charge native de la détection d'OBB. YOLO11, en particulier, offre une précision de pointe sans compromettre la vitesse, ce qui en fait une option intéressante pour les applications en temps réel.

Les modèlesYOLO11 OBB pré-entraînés, tels que obb, sont entraînés sur des ensembles de données tels que DOTAv1, qui consiste en des images aériennes annotées avec une gamme de classes d'objets tels que des avions, des navires et des courts de tennis qui apparaissent sous différents angles et orientations. 

De plus, ces modèles sont disponibles en cinq tailles différentes, de nano (obb) à extra-large (obb), pour répondre aux différents besoins de performance. Cette polyvalence leur permet d'être utilisés dans divers secteurs, depuis la surveillance des infrastructures urbaines et l'inspection des machines jusqu'à la lecture de textes inclinés dans des documents numérisés.

Formation personnalisée YOLO11 pour la détection de boîtes de délimitation orientées

Dans de nombreuses situations réelles, les objets que vous devez detect peuvent être totalement différents de ceux des ensembles de données de formation standard. Par exemple, des objets tels que des outils sur une chaîne de production, des emballages de produits ou des composants sur un circuit imprimé peuvent être tournés, placés de manière irrégulière ou avoir une forme différente. 

Pour detect avec précision ces objets personnalisés, en particulier lorsque l'orientation est importante, il est important d'entraîner des modèles tels que YOLO11 à l'aide de vos propres images et étiquettes. Ce processus est connu sous le nom d'entraînement personnalisé

Voici un aperçu de la procédure étape par étape pour former YOLO11 à la détection des OBB :

  • Collecte d'images : Rassemblez des images qui présentent vos objets cibles sous différents angles, positions et environnements réels.
  • Annotation d'objet : Étiquetez chaque objet à l'aide de boîtes englobantes pivotées (OBB) pour capturer à la fois leur emplacement et leur orientation à l'aide d'outils d'annotation prenant en charge les OBB.
  • Préparation du jeu de données: Organisez vos images et vos étiquettes dans la structure de répertoire de YOLO et créez un fichier de configuration YAML avec vos noms de classes et les chemins d'accès aux jeux de données.
  • Entraînement du modèle: Choisissez une version du modèle YOLO11 qui correspond à vos besoins et lancez le processus de formation pour que le modèle puisse apprendre à partir de vos images étiquetées.
  • Évaluation et déploiement : Testez votre modèle entraîné sur de nouvelles images, évaluez sa précision et déployez-le dans des applications pratiques telles que la fabrication, la surveillance aérienne ou l'analyse de documents.

Applications permises par la détection OBB

Les objets qui sont décentrés ou inclinés sont assez courants dans les scénarios réels. Examinons quelques exemples où la détection OBB fait une réelle différence en détectant avec précision ces objets.

Analyse d'images radiographiques à l'aide de la détection OBB

La détection OBB peut faire progresser l'analyse d'images médicales en améliorant la précision. Les images médicales comprennent souvent des structures anatomiques telles que des tumeurs, des organes ou des os. Ces structures apparaissent souvent sous des formes irrégulières et des orientations variées. Étant donné que les OBB peuvent pivoter pour correspondre à l'angle d'un objet, elles offrent une localisation et une mesure plus précises, ce qui est essentiel pour le diagnostic et la planification du traitement.

Cette approche est particulièrement efficace lorsqu'il s'agit d'analyser des images radiographiques de fractures osseuses, où la position et l'alignement des os sont des facteurs clés. Par exemple, la détection OBB a été utilisée pour analyser les radiographies du coude d'enfants. En s'adaptant à l'orientation des os, elle a contribué à améliorer la précision de la détection. 

__wf_reserved_inherit
Fig 3. Radiographies (a, d) avec détection d'objets (b, e) et détection de boîtes englobantes orientées (c, f).

Surveillance aérienne optimisée par la détection OBB

La surveillance aérienne est un outil essentiel dans des secteurs tels que la sécurité publique, la surveillance de l'environnement et l'urbanisme. Les images capturées par des drones ou des satellites peuvent aider à identifier des objets tels que des navires, des véhicules ou des bâtiments. Cependant, sur ces images, les objets apparaissent souvent petits et sous des angles inhabituels, ce qui les rend plus difficiles à detect avec précision.

La détection OBB résout ce problème en inclinant les boîtes englobantes pour qu'elles correspondent à l'angle de chaque objet. Cela permet d'obtenir des mesures plus précises de la taille et de l'orientation d'un objet, ce qui favorise une meilleure prise de décision dans des domaines tels que l'urbanisme, la défense, la réponse aux catastrophes et la surveillance environnementale.

Un exemple intéressant de détection d'OBB est le suivi des navires dans la surveillance maritime. Les images satellites capturent souvent les navires sous différents angles et tailles en raison des conditions météorologiques, de l'éclairage ou du mouvement. Les OBB peuvent s'adapter à ces changements, améliorant ainsi la détection, en particulier pour les navires plus petits ou partiellement masqués.

__wf_reserved_inherit
Fig 4. Un aperçu de l'utilisation de la détection OBB pour la surveillance maritime.

Utilisation de la détection OBB dans l'agriculture

Le tri des cultures après la récolte est une étape cruciale pour garantir leur qualité avant qu'elles ne soient emballées et envoyées sur le marché. Si de nombreux systèmes fonctionnent bien pour les fruits ronds comme les pommes et les oranges, les cultures longues et étroites, comme les carottes ou les pousses de Zizania, peuvent être beaucoup plus difficiles à manipuler. Leurs formes varient et ils se retrouvent souvent sous des angles différents, ce qui les rend difficiles à detect et à trier avec précision.

Pour remédier à ce problème, les chercheurs ont mis au point un système qui utilise la détection de la boîte de délimitation orientée (OBB) pour identifier et classer ces cultures avec plus de précision. Le système peut detect plusieurs cultures sur une même image, même si elles sont inclinées ou se chevauchent, et évaluer leur qualité et leur position en temps réel.

Avantages et inconvénients de la détection OBB

Voici quelques avantages de l'utilisation de la détection OBB :

  • Amélioration des entrées pour les tâches en aval : Les tâches de vision par ordinateur telles que la segmentation d'instance et le suivi d'objets peuvent être plus performantes si elles reçoivent des détections d'objets plus précises.

  • Raisonnement spatial amélioré : En capturant l'angle d'orientation, les OBB permettent de comprendre l'alignement et la direction d'un objet.

  • Réduction du chevauchement dans les scènes encombrées : Les OBB réduisent l'ambiguïté en ajustant plus étroitement les objets, même dans les scènes chargées ou encombrées.

Bien qu'elle contribue à améliorer la précision de la détection dans les scènes complexes, la détection OBB présente quelques limitations à prendre en compte :

  • Plus grande sensibilité au bruit : De petites erreurs dans la prédiction de l'angle peuvent avoir un impact plus important sur la précision de la détection, en particulier pour les objets étroitement emballés ou allongés.
  • Outils spécialisés requis : Étant donné que toutes les plateformes d'étiquetage et de formation ne prennent pas en charge nativement les OBB, leur utilisation peut nécessiter des outils ou une configuration supplémentaires.

  • Disponibilité limitée des ensembles de données : Comparé à la détection d'objets standard, il existe actuellement moins d'ensembles de données disponibles publiquement avec des annotations OBB, ce qui peut rendre légèrement plus difficile de démarrer ou de comparer les résultats.

Principaux points à retenir

La détection de boîtes englobantes orientées facilite la reconnaissance par les solutions de vision par ordinateur des objets qui ne sont pas parfaitement droits ou alignés. En capturant à la fois la position et l'orientation des objets, la détection OBB améliore la précision dans des cas d'utilisation réels tels que la numérisation d'images médicales, la surveillance des terres agricoles ou l'analyse de photos satellites.

Avec des modèles comme YOLO11 qui rendent la détection OBB plus accessible, elle devient un choix pratique pour de nombreuses industries. Qu'il s'agisse d'objets inclinés, se chevauchant ou de formes bizarres, la détection OBB apporte une précision supplémentaire que les méthodes standard ne parviennent pas toujours à obtenir.

L'IA vous intéresse ? Explorez notre dépôt GitHub, connectez-vous avec notre communauté et consultez nos options de licence pour démarrer votre projet de vision par ordinateur. Apprenez-en davantage sur les innovations telles que l'IA dans le commerce de détail et la vision par ordinateur dans le secteur de la logistique sur nos pages de solutions.

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement