Qu'est-ce que la détection par boîte englobante orientée (OBB) ?
Explore comment la détection par boîte englobante orientée (OBB) améliore la détection d'objets en identifiant précisément les objets pivotés dans les images pour des applications réelles.

Reconnaître des objets, peu importe leur disposition ou leur orientation, est naturel pour nous, en tant qu'humains. Qu'il s'agisse de voitures à une intersection ou de bateaux dans un port, nous pouvons facilement identifier ce qu'ils sont et dans quelle direction ils pointent. Cependant, pour les systèmes d'intelligence artificielle (IA), ce n'est pas aussi simple.
Par exemple, la vision par ordinateur, une branche de l'IA axée sur la compréhension des images et des vidéos, permet des tâches comme la détection d'objets, ce qui aide les machines à identifier et localiser des objets dans une scène. La détection d'objets traditionnelle repose sur des boîtes englobantes alignées sur les axes pour tracer des boîtes autour des objets. Ces boîtes ont des côtés droits et des angles droits fixes. Cette approche fonctionne bien lorsque les objets sont verticaux et pas trop proches les uns des autres.
Mais lorsque les objets sont inclinés, pivotés ou proches les uns des autres, la détection d'objets traditionnelle a souvent du mal à les capturer avec précision. Pour gérer ces situations plus complexes, des techniques comme la détection par boîte englobante orientée (OBB) ont été introduites. Contrairement aux boîtes englobantes standard, les OBB peuvent pivoter pour correspondre à l'angle et à la forme de l'objet, permettant un ajustement plus serré et plus précis.
Les modèles de vision par ordinateur comme Ultralytics YOLO11, qui prennent en charge la détection OBB, permettent une gamme d'applications en temps réel, surtout dans des scénarios où l'orientation de l'objet compte, comme la surveillance aérienne. Au-delà, la détection OBB est également utilisée dans la santé, l'agriculture et l'analyse de documents.
Dans cet article, nous explorerons ce qu'est la détection OBB, comment elle fonctionne et où elle est appliquée dans des scénarios réels. Commençons !

Fig 1. Un exemple de démonstration de l'utilisation de YOLO11 pour la détection OBB de bateaux.
Link to this sectionQu'est-ce qu'une boîte englobante orientée ?#
Une boîte englobante orientée est un type de boîte rectangulaire utilisée en vision par ordinateur pour représenter les objets détectés dans une image. Alors que les boîtes englobantes standard sont alignées avec les axes horizontaux et verticaux de l'image, les OBB peuvent pivoter pour correspondre à l'angle réel de l'objet.
Cette capacité de rotation apporte plusieurs avantages. Les OBB peuvent s'aligner plus étroitement avec l'orientation d'un objet, permettant à la boîte de s'ajuster parfaitement autour de la forme et de la direction de l'objet. En conséquence, la détection devient plus précise et exacte.
Les OBB sont particulièrement utiles lorsque les objets ne sont pas parfaitement verticaux, comme une voiture tournant sur une route courbée dans des images aériennes, un livre incliné sur un bureau ou une tumeur pivotée dans une analyse médicale. En correspondant plus précisément à l'angle d'un objet, les OBB améliorent les performances de détection, réduisent l'interférence de l'arrière-plan et sont particulièrement adaptées aux applications où l'orientation d'un objet compte autant que sa position.

Fig 2. Comparaison de la détection d'objets et de la détection OBB.
Link to this sectionDétection OBB vs détection d'objets#
La détection OBB et la détection d'objets traditionnelle peuvent sembler similaires au premier abord, mais elles sont utilisées de manières différentes et pour des situations différentes. Regardons de plus près comment elles se comparent avec un exemple.
Les modèles de vision par ordinateur, comme YOLO11, peuvent être entraînés pour détecter et classifier des objets dans diverses applications réelles, comme l'inspection industrielle. Considérez une chaîne de montage en usine où différentes pièces mécaniques se déplacent sur un tapis roulant. Certaines pièces peuvent être soigneusement placées, mais d'autres peuvent être légèrement pivotées, inclinées ou se chevaucher en raison des vibrations ou de la vitesse.
La détection d'objets traditionnelle utilise des boîtes rectangulaires verticales qui s'alignent avec les bords horizontaux et verticaux de l'image. Ainsi, lorsqu'une pièce est pivotée, la boîte peut ne pas s'ajuster correctement - elle pourrait exclure une partie de l'objet ou inclure trop d'arrière-plan. Cela peut rendre les détections moins précises et plus difficiles à identifier pour le système de manière confiante.
Maintenant, disons que tu utilises la détection OBB à la place. Dans ce cas, le modèle peut dessiner une boîte qui pivote pour correspondre à l'angle exact de chaque pièce. Un engrenage incliné ou un composant orienté sera étroitement entouré par une boîte qui correspond à sa forme et à sa direction. Cela signifie une meilleure précision, moins d'erreurs et des résultats plus fiables, surtout en ce qui concerne les cas d'utilisation comme le contrôle qualité automatisé ou le tri robotisé.
Link to this sectionModèles de détection OBB populaires#
Maintenant que tu as une meilleure compréhension de ce qu'est la détection OBB, jetons un œil à certains des modèles d'IA de vision les plus largement utilisés qui la prennent en charge.
Plusieurs modèles avancés de vision par ordinateur ont été développés spécifiquement pour détecter des objets pivotés ou inclinés. Parmi eux, les modèles Ultralytics YOLO sont particulièrement bien connus pour leurs capacités de détection OBB fiables et efficaces.
Les versions antérieures comme Ultralytics YOLOv5 étaient conçues pour la détection d'objets standard. Des itérations ultérieures, telles que Ultralytics YOLOv8 et le plus récent YOLO11, ont introduit une prise en charge native de la détection OBB. YOLO11, en particulier, offre une précision de pointe sans compromettre la vitesse, ce qui en fait une option percutante pour les applications en temps réel.
Les modèles YOLO11 OBB pré-entraînés, comme YOLO11n-obb, sont entraînés sur des datasets comme DOTAv1, qui consiste en des images aériennes annotées avec une gamme de classes d'objets comme des avions, des navires et des courts de tennis qui apparaissent sous divers angles et orientations.
De plus, ces modèles sont disponibles en cinq tailles différentes, de nano (n-obb) à extra-large (x-obb), pour répondre à différents besoins de performance. Cette polyvalence leur permet d'être appliqués à travers diverses industries - de la surveillance des infrastructures urbaines et l'inspection de machines à la lecture de texte incliné dans des documents scannés.
Link to this sectionEntraînement personnalisé de YOLO11 pour la détection par boîte englobante orientée#
Dans de nombreuses situations réelles, les objets que tu dois détecter peuvent être entièrement différents de ceux présents dans les datasets d'entraînement standard. Par exemple, des objets comme des outils sur une ligne de production, des emballages de produits ou des composants sur une carte de circuit imprimé peuvent être pivotés, placés de manière irrégulière ou formés différemment.
Pour détecter avec précision ces objets personnalisés, surtout lorsque l'orientation compte, il est important d'entraîner des modèles comme YOLO11 en utilisant tes propres images et étiquettes. Ce processus est connu sous le nom d'entraînement personnalisé.
Voici un aperçu plus détaillé du processus étape par étape pour entraîner YOLO11 à la détection OBB :
- Collecte d'images : Rassemble des images qui présentent tes objets cibles sous différents angles, positions et environnements réels.
- Annotation d'objets : Étiquette chaque objet en utilisant des boîtes englobantes pivotées (OBB) pour capturer à la fois leur emplacement et leur orientation en utilisant des outils d'annotation avec prise en charge OBB.
- Préparation du dataset : Organise tes images et tes étiquettes dans la structure de répertoire YOLO, et crée un fichier de configuration YAML avec tes noms de classe et les chemins de tes datasets.
- Entraînement du modèle : Choisis une version du modèle YOLO11 qui correspond à tes besoins et lance le processus d'entraînement pour que le modèle puisse apprendre à partir de tes images étiquetées.
- Évaluation et déploiement : Teste ton modèle entraîné sur de nouvelles images, évalue sa précision et déploie-le dans des applications pratiques comme la fabrication, la surveillance aérienne ou l'analyse de documents.
Link to this sectionApplications activées par la détection OBB#
Les objets qui sont décentrés ou inclinés sont assez courants dans les scénarios de la vie réelle. Passons en revue quelques exemples où la détection OBB fait une réelle différence en détectant avec précision ces objets.
Link to this sectionAnalyse d'images radiographiques utilisant la détection OBB#
La détection OBB peut pousser l'analyse d'images médicales plus loin en améliorant la précision. Les images médicales incluent souvent des structures anatomiques telles que des tumeurs, des organes ou des os. Ces structures apparaissent souvent avec des formes irrégulières et des orientations variées. Comme les OBB peuvent pivoter pour correspondre à l'angle d'un objet, ils fournissent une localisation et une mesure plus précises, ce qui est critique pour le diagnostic et la planification du traitement.
Cette approche est particulièrement efficace lorsqu'il s'agit d'analyser des images radiographiques de fractures osseuses, où la position et l'alignement des os sont des facteurs clés. Par exemple, la détection OBB a été utilisée pour analyser des radiographies du coude pédiatrique. En s'ajustant à l'orientation des os, elle a aidé à améliorer la précision de la détection.

Fig 3. Radiographies (a, d) avec détection d'objets (b, e) et détection par boîte englobante orientée (c, f).
Link to this sectionSurveillance aérienne propulsée par la détection OBB#
La surveillance aérienne est un outil essentiel dans des secteurs comme la sécurité publique, la surveillance environnementale et l'urbanisme. Les images capturées par des drones ou des satellites peuvent aider à identifier des objets tels que des navires, des véhicules et des bâtiments. Cependant, dans ces images, les objets apparaissent souvent petits et sous des angles inhabituels, ce qui les rend plus difficiles à détecter avec précision.
La détection OBB résout cela en inclinant les boîtes englobantes pour correspondre à l'angle de chaque objet. Cela conduit à des mesures plus précises de la taille et de l'orientation d'un objet, favorisant une meilleure prise de décision dans des domaines tels que l'urbanisme, la défense, la réponse aux catastrophes et la surveillance environnementale.
Un exemple intéressant de détection OBB est le suivi des navires dans la surveillance maritime. Les images satellites capturent souvent des navires sous des angles et tailles variés en raison de la météo, de l'éclairage ou du mouvement. Les OBB peuvent s'adapter à ces changements, améliorant la détection, surtout pour les navires plus petits ou partiellement obscurcis.

Fig 4. Un aperçu de l'utilisation de la détection OBB pour la surveillance maritime.
Link to this sectionUtilisation de la détection OBB en agriculture#
Le tri des cultures après la récolte est une étape cruciale pour garantir la qualité avant qu'elles ne soient emballées et envoyées sur le marché. Alors que de nombreux systèmes fonctionnent bien pour les fruits ronds comme les pommes et les oranges, les cultures longues et étroites, comme les carottes ou les pousses de Zizania, peuvent être beaucoup plus difficiles à manipuler. Leurs formes varient, et elles finissent souvent sous différents angles, les rendant délicates à détecter et à trier avec précision.
Pour résoudre ce problème, des chercheurs ont développé un système qui utilise la détection par boîte englobante orientée (OBB) pour identifier et classer ces cultures plus précisément. Le système peut détecter plusieurs cultures dans une seule image, même si elles sont inclinées ou se chevauchent, et évaluer leur qualité et leur position en temps réel.
Link to this sectionAvantages et inconvénients de la détection OBB#
Voici quelques-uns des avantages de l'utilisation de la détection OBB :
- Amélioration des entrées pour les tâches en aval : Les tâches de vision par ordinateur comme la segmentation d'instance et le suivi d'objets peuvent mieux fonctionner lorsqu'on leur fournit des détections d'objets plus précises.
- Raisonnement spatial amélioré : En capturant l'angle d'orientation, les OBB rendent possible la compréhension de l'alignement et de la direction d'un objet.
- Chevauchement réduit dans les scènes encombrées : Les OBB réduisent l'ambiguïté en ajustant les objets plus étroitement, même dans des scènes chargées ou encombrées.
Malgré l'amélioration de la précision de la détection dans les scènes complexes, la détection OBB présente quelques limitations à prendre en compte :
- Plus grande sensibilité au bruit : De petites erreurs dans la prédiction de l'angle peuvent avoir un impact plus important sur la précision de la détection, surtout pour les objets étroitement emballés ou allongés.
- Outils spécialisés requis : Comme toutes les plateformes d'étiquetage et d'entraînement ne prennent pas nativement en charge les OBB, travailler avec eux peut nécessiter des outils ou une configuration supplémentaire.
- Disponibilité limitée des datasets : Comparé à la détection d'objets standard, il existe actuellement moins de datasets accessibles au public avec des annotations OBB, ce qui peut rendre un peu plus difficile le démarrage ou la comparaison des résultats.
Link to this sectionPoints clés#
La détection par boîte englobante orientée facilite la reconnaissance par les solutions de vision par ordinateur d'objets qui ne sont pas parfaitement droits ou alignés. En capturant à la fois la position et l'orientation des objets, la détection OBB booste la précision dans des cas d'utilisation réels tels que le scan d'images médicales, la surveillance de terres agricoles ou l'analyse de photos satellites.
Avec des modèles comme YOLO11 rendant la détection OBB plus accessible, cela devient un choix pratique pour de nombreuses industries. Que tu traites des objets inclinés, qui se chevauchent ou aux formes étranges, la détection OBB ajoute une couche supplémentaire de précision que les méthodes standard manquent souvent.
Curieux à propos de l'IA ? Explore notre dépôt GitHub, connecte-toi avec notre communauté et consulte nos options de licence pour lancer ton projet de vision par ordinateur. Apprends-en plus sur des innovations comme l'IA dans le commerce de détail et la vision par ordinateur dans l'industrie logistique sur nos pages de solutions.






