Qu'est-ce que la détection de boîtes englobantes orientées (OBB) ?

5 minutes de lecture

9 juin 2025

Découvrez comment la détection de boîtes de délimitation orientées (OBB) améliore la détection d'objets en identifiant précisément les objets tournés dans les images dans des applications du monde réel.

Reconnaître les objets, quelle que soit leur disposition ou leur orientation, est naturel pour l'être humain. Qu'il s'agisse de voitures à un carrefour ou de bateaux dans un port, nous pouvons facilement déterminer ce qu'ils sont et dans quelle direction ils sont orientés. Toutefois, pour les systèmes d'intelligence artificielle (IA), ce n'est pas aussi simple.

Par exemple, la vision artificielle, une branche de l'intelligence artificielle axée sur la compréhension des images et des vidéos, permet d'effectuer des tâches telles que la détection d'objets, qui aide les machines à identifier et à localiser des objets dans une scène. La détection d'objets traditionnelle s'appuie sur des boîtes de délimitation alignées sur les axes pour dessiner des boîtes autour des objets. Ces boîtes ont des côtés droits et des angles droits fixes. Cette approche fonctionne bien lorsque les objets sont droits et pas trop proches les uns des autres. 

Mais lorsque les objets sont inclinés, tournés ou proches les uns des autres, la détection traditionnelle d'objets a souvent du mal à les capturer avec précision. Pour gérer ces situations plus complexes, des techniques telles que la détection de boîtes de délimitation orientées (OBB) ont été introduites. Contrairement aux boîtes de délimitation standard, les OBB peuvent pivoter pour s'adapter à l'angle et à la forme de l'objet, ce qui permet une adaptation plus étroite et plus précise.

Les modèles de vision par ordinateur comme Ultralytics YOLO11, qui prennent en charge la détection des OBB, permettent une série d'applications en temps réel, en particulier dans les scénarios où l'orientation de l'objet est importante, comme la surveillance aérienne. En outre, la détection des OBB est également utilisée dans les domaines de la santé, de l'agriculture et de l'analyse de documents.

Dans cet article, nous verrons ce qu'est la détection OBB, comment elle fonctionne et où elle est appliquée dans des scénarios réels. Commençons par le commencement !

__wf_reserved_inherit
Fig. 1. Exemple de démonstration de l'utilisation de YOLO11 pour la détection d'OBB sur les bateaux.

Qu'est-ce qu'une boîte de délimitation orientée ?

Une boîte de délimitation orientée est un type de boîte rectangulaire utilisée en vision artificielle pour représenter les objets détectés dans une image. Alors que les boîtes de délimitation standard sont alignées sur les axes horizontaux et verticaux de l'image, les boîtes de délimitation orientées peuvent pivoter pour correspondre à l'angle réel de l'objet.

Cette capacité de rotation présente plusieurs avantages. Les OBB peuvent s'aligner plus étroitement sur l'orientation d'un objet, ce qui permet à la boîte d'épouser étroitement la forme et la direction de l'objet. La détection devient ainsi plus précise et plus exacte.

Les OBB sont particulièrement utiles lorsque les objets ne sont pas parfaitement droits, comme une voiture tournant sur une route incurvée dans une séquence aérienne, un livre incliné sur un bureau ou une tumeur pivotée dans un scanner médical. En correspondant plus précisément à l'angle d'un objet, les OBB améliorent les performances de détection, réduisent les interférences d'arrière-plan et sont particulièrement utiles pour les applications où l'orientation d'un objet est aussi importante que sa position.

__wf_reserved_inherit
Fig. 2. Comparaison entre la détection d'objets et la détection d'OBB.

Détection d'OBB et détection d'objets

La détection OBB et la détection traditionnelle d'objets peuvent sembler similaires à première vue, mais elles sont utilisées de manière différente et dans des situations différentes. Examinons de plus près leur comparaison à l'aide d'un exemple.

Les modèles de vision par ordinateur, comme YOLO11, peuvent être entraînés à détecter et à classer des objets dans diverses applications du monde réel, telles que l'inspection industrielle. Prenons l'exemple d'une chaîne d'assemblage où différentes pièces de machines se déplacent le long d'un tapis roulant. Certaines pièces peuvent être bien placées, mais d'autres peuvent être légèrement tournées, inclinées ou se chevaucher en raison des vibrations ou de la vitesse.

La détection traditionnelle d'objets utilise des boîtes rectangulaires droites qui s'alignent sur les bords horizontaux et verticaux de l'image. Ainsi, lorsqu'une pièce est tournée, la boîte peut ne pas s'ajuster correctement - elle peut laisser de côté une partie de l'objet ou inclure une trop grande partie de l'arrière-plan. Les détections risquent alors d'être moins précises et il sera plus difficile pour le système d'identifier la pièce en toute confiance.

Supposons maintenant que vous utilisiez plutôt la détection OBB. Dans ce cas, le modèle peut dessiner une boîte qui pivote pour correspondre à l'angle exact de chaque pièce. Un engrenage incliné ou un composant angulaire sera étroitement entouré d'une boîte qui correspond à sa forme et à sa direction. Cela signifie une meilleure précision, moins d'erreurs et des résultats plus fiables, en particulier dans des cas d'utilisation tels que le contrôle qualité automatisé ou le triage robotisé.

Modèles populaires de détection des OBB

Maintenant que nous comprenons mieux ce qu'est la détection des OBB, examinons quelques-uns des modèles Vision AI les plus répandus qui la prennent en charge.

Plusieurs modèles avancés de vision par ordinateur ont été développés spécifiquement pour la détection d'objets tournés ou inclinés. Parmi eux, les modèles Ultralytics YOLO sont particulièrement connus pour leurs capacités de détection fiable et efficace des OBB.

Les versions antérieures, comme Ultralytics YOLOv5, étaient conçues pour la détection d'objets standard. Les versions ultérieures, comme Ultralytics YOLOv8 et la plus récente YOLO11, ont introduit la prise en charge native de la détection d'OBB. YOLO11, en particulier, offre une précision de pointe sans compromettre la vitesse, ce qui en fait une option intéressante pour les applications en temps réel.

Les modèles YOLO11 OBB pré-entraînés, tels que YOLO11n-obb, sont entraînés sur des ensembles de données tels que DOTAv1, qui consiste en des images aériennes annotées avec une gamme de classes d'objets tels que des avions, des navires et des courts de tennis qui apparaissent sous différents angles et orientations. 

De plus, ces modèles sont disponibles en cinq tailles différentes, de nano (n-obb) à extra-large (x-obb), pour répondre aux différents besoins de performance. Cette polyvalence leur permet d'être utilisés dans divers secteurs, depuis la surveillance des infrastructures urbaines et l'inspection des machines jusqu'à la lecture de textes inclinés dans des documents numérisés.

Formation personnalisée YOLO11 pour la détection de boîtes de délimitation orientées

Dans de nombreuses situations réelles, les objets que vous devez détecter peuvent être totalement différents de ceux des ensembles de données de formation standard. Par exemple, des objets tels que des outils sur une chaîne de production, des emballages de produits ou des composants sur un circuit imprimé peuvent être tournés, placés de manière irrégulière ou avoir une forme différente. 

Pour détecter avec précision ces objets personnalisés, en particulier lorsque l'orientation est importante, il est important d'entraîner des modèles tels que YOLO11 à l'aide de vos propres images et étiquettes. Ce processus est connu sous le nom d'entraînement personnalisé

Voici un aperçu de la procédure étape par étape pour former YOLO11 à la détection des OBB :

  • Collecte d'images: Rassemblez des images qui présentent vos objets cibles sous différents angles, positions et environnements réels.
  • Annotation des objets: Étiqueter chaque objet à l'aide de boîtes de délimitation tournantes (OBB) pour saisir leur emplacement et leur orientation en utilisant des outils d'annotation prenant en charge les OBB.
  • Préparation du jeu de données: Organisez vos images et vos étiquettes dans la structure de répertoire de YOLO et créez un fichier de configuration YAML avec vos noms de classes et les chemins d'accès aux jeux de données.
  • Entraînement du modèle: Choisissez une version du modèle YOLO11 qui correspond à vos besoins et lancez le processus de formation pour que le modèle puisse apprendre à partir de vos images étiquetées.
  • Évaluation et déploiement: Testez votre modèle entraîné sur de nouvelles images, évaluez sa précision et déployez-le dans des applications pratiques telles que la fabrication, la surveillance aérienne ou l'analyse de documents.

Applications rendues possibles par la détection des OBB

Les objets décentrés ou inclinés sont très courants dans les scénarios de la vie réelle. Voyons quelques exemples où la détection OBB fait une réelle différence en détectant ces objets avec précision.

Analyse d'images radiographiques à l'aide de la détection OBB

La détection des OBB peut faire progresser l'analyse des images médicales en améliorant la précision. Les images médicales comportent souvent des structures anatomiques telles que des tumeurs, des organes ou des os. Ces structures présentent souvent des formes irrégulières et des orientations variées. Comme les OBB peuvent pivoter pour s'adapter à l'angle d'un objet, ils permettent une localisation et une mesure plus précises, ce qui est essentiel pour le diagnostic et la planification du traitement.

Cette approche est particulièrement efficace lorsqu'il s'agit d'analyser des images radiographiques de fractures osseuses, où la position et l'alignement des os sont des facteurs clés. Par exemple, la détection OBB a été utilisée pour analyser des radiographies de coudes d'enfants. En s'adaptant à l'orientation des os, elle a permis d'améliorer la précision de la détection. 

__wf_reserved_inherit
Fig. 3. Radiographies (a, d) avec détection d'objets (b, e) et détection de la boîte englobante orientée (c, f).

Surveillance aérienne grâce à la détection des OBB

La surveillance aérienne est un outil essentiel dans des secteurs tels que la sécurité publique, la surveillance de l'environnement et l'urbanisme. Les images capturées par des drones ou des satellites peuvent aider à identifier des objets tels que des navires, des véhicules ou des bâtiments. Cependant, sur ces images, les objets apparaissent souvent petits et sous des angles inhabituels, ce qui les rend plus difficiles à détecter avec précision.

La détection OBB résout ce problème en inclinant les boîtes de délimitation pour qu'elles correspondent à l'angle de chaque objet. On obtient ainsi des mesures plus précises de la taille et de l'orientation d'un objet, ce qui permet de prendre de meilleures décisions dans des domaines tels que l'urbanisme, la défense, les interventions en cas de catastrophe et la surveillance de l'environnement.

Un exemple intéressant de détection OBB est le suivi des navires dans le cadre de la surveillance maritime. Les images satellites capturent souvent les navires sous des angles et des tailles variables en raison des conditions météorologiques, de l'éclairage ou des mouvements. Les OBB peuvent s'adapter à ces changements et améliorer la détection, en particulier pour les navires plus petits ou partiellement masqués.

__wf_reserved_inherit
Fig. 4. Aperçu de l'utilisation de la détection des OBB pour la surveillance maritime.

Utilisation de la détection des OBB dans l'agriculture

Le tri des cultures après la récolte est une étape cruciale pour garantir leur qualité avant qu'elles ne soient emballées et envoyées sur le marché. Si de nombreux systèmes fonctionnent bien pour les fruits ronds comme les pommes et les oranges, les cultures longues et étroites, comme les carottes ou les pousses de Zizania, peuvent être beaucoup plus difficiles à manipuler. Leurs formes varient et ils se retrouvent souvent sous des angles différents, ce qui les rend difficiles à détecter et à trier avec précision.

Pour remédier à ce problème, les chercheurs ont mis au point un système qui utilise la détection des boîtes de délimitation orientées (OBB) pour identifier et classer ces cultures avec plus de précision. Le système peut détecter plusieurs cultures sur une même image, même si elles sont inclinées ou se chevauchent, et évaluer leur qualité et leur position en temps réel.

Avantages et inconvénients de la détection des OBB

Voici quelques-uns des avantages de la détection des OBB :

  • Amélioration des données d'entrée pour les tâches en aval : Lestâches de vision par ordinateur telles que la segmentation des instances et le suivi des objets peuvent être plus performantes lorsqu'elles bénéficient de détections d'objets plus précises.

  • Amélioration du raisonnement spatial : En capturant l'angle d'orientation, les OBB permettent de comprendre l'alignement et la direction d'un objet.

  • Réduction du chevauchement dans les scènes encombrées : Les OBB réduisent l'ambiguïté en ajustant plus étroitement les objets, même dans les scènes encombrées.

Bien qu'elle permette d'améliorer la précision de la détection dans les scènes complexes, la détection des OBB présente quelques limites à prendre en compte :

  • Une plus grande sensibilité au bruit : De petites erreurs dans la prédiction de l'angle peuvent avoir un impact plus important sur la précision de la détection, en particulier pour les objets très serrés ou allongés.
  • Outils spécialisés requis : Comme toutes les plateformes d'étiquetage et de formation ne prennent pas en charge les OBB de manière native, leur utilisation peut nécessiter des outils ou une configuration supplémentaires.

  • Disponibilité limitée des données : Par rapport à la détection d'objets standard, il y a actuellement moins d'ensembles de données accessibles au public avec des annotations OBB, ce qui peut rendre un peu plus difficile le démarrage ou la comparaison des résultats.

Principaux enseignements

La détection de la boîte de délimitation orientée permet aux solutions de vision par ordinateur de reconnaître plus facilement les objets qui ne sont pas parfaitement droits ou alignés. En capturant à la fois la position et l'orientation des objets, la détection OBB améliore la précision dans des cas d'utilisation réels tels que la numérisation d'images médicales, la surveillance des terres agricoles ou l'analyse de photos satellites.

Avec des modèles comme YOLO11 qui rendent la détection OBB plus accessible, elle devient un choix pratique pour de nombreuses industries. Qu'il s'agisse d'objets inclinés, se chevauchant ou de formes bizarres, la détection OBB apporte une précision supplémentaire que les méthodes standard ne parviennent pas toujours à obtenir.

Curieux de l'IA ? Explorez notre dépôt GitHub, entrez en contact avec notre communauté et consultez nos options de licence pour démarrer votre projet de vision par ordinateur. Pour en savoir plus sur des innovations telles que l 'IA dans le commerce de détail et la vision par ordinateur dans le secteur de la logistique, consultez nos pages consacrées aux solutions.

Construisons ensemble le futur
de l'IA !

Commencez votre voyage avec l'avenir de l'apprentissage automatique

Commencer gratuitement
Lien copié dans le presse-papiers