Yolo Vision Shenzhen
Shenzhen
Únete ahora

¿Qué es la detección de cajas delimitadoras orientadas (OBB)?

5 minutos de lectura

9 de junio de 2025

Descubra cómo la detección de cajas delimitadoras orientadas (OBB) mejora la detección de objetos al identificar con precisión objetos rotados en imágenes en aplicaciones del mundo real.

Reconocer objetos, independientemente de cómo estén dispuestos o hacia dónde estén orientados, es algo natural para nosotros como humanos. Ya sean coches en una intersección o barcos en un puerto, podemos decir fácilmente qué son y hacia dónde apuntan. Sin embargo, para los sistemas de inteligencia artificial (IA), no es tan sencillo.

Por ejemplo, la visión artificial, una rama de la IA centrada en la comprensión de imágenes y vídeos, permite tareas como la detección de objetos, que ayuda a las máquinas a identificar y localizar objetos dentro de una escena. La detección de objetos tradicional se basa en cajas delimitadoras alineadas con los ejes para dibujar cajas alrededor de los objetos. Estas cajas tienen lados rectos y ángulos rectos fijos. Este enfoque funciona bien cuando los objetos están verticales y no demasiado juntos. 

Pero cuando los objetos están inclinados, rotados o muy juntos, la detección de objetos tradicional a menudo tiene dificultades para capturarlos con precisión. Para manejar estas situaciones más complejas, se han introducido técnicas como la detección de cajas delimitadoras orientadas (OBB). A diferencia de las cajas delimitadoras estándar, las OBB pueden rotar para coincidir con el ángulo y la forma del objeto, lo que permite un ajuste más preciso.

Modelos de visión por ordenador como Ultralytics YOLO11que admiten la detección de OBB, permiten una serie de aplicaciones en tiempo real, especialmente en escenarios en los que la orientación del objeto es importante, como la vigilancia aérea. Además, la detección de OBB también se utiliza en la sanidad, la agricultura y el análisis de documentos.

En este artículo, exploraremos qué es la detección OBB, cómo funciona y dónde se está aplicando en escenarios del mundo real. ¡Empecemos!

__wf_reserved_inherit
Fig. 1. Ejemplo de demostración del uso de YOLO11 para la detección de OBB en embarcaciones.

¿Qué es un bounding box orientado?

Un bounding box orientado es un tipo de caja rectangular utilizada en visión artificial para representar objetos detectados en una imagen. Mientras que los bounding boxes estándar están alineados con los ejes horizontal y vertical de la imagen, los OBB pueden rotar para coincidir con el ángulo real del objeto.

Esta capacidad de rotar aporta varias ventajas. Las OBB pueden alinearse más estrechamente con la orientación de un objeto, lo que permite que la caja se ajuste perfectamente a la forma y dirección del objeto. Como resultado, la detección se vuelve más precisa.

Las OBB son especialmente útiles cuando los objetos no están perfectamente verticales, como un automóvil que gira en una carretera curva en imágenes aéreas, un libro inclinado sobre un escritorio o un tumor rotado en una exploración médica. Al coincidir con el ángulo de un objeto con mayor precisión, las OBB mejoran el rendimiento de la detección, reducen la interferencia del fondo y son particularmente excelentes para aplicaciones donde la orientación de un objeto importa tanto como su posición.

__wf_reserved_inherit
Fig. 2. Comparación entre la detección de objetos y la detección de OBB.

Detección OBB vs. detección de objetos

La detección OBB y la detección de objetos tradicional pueden parecer similares al principio, pero se utilizan de diferentes maneras y para diferentes situaciones. Analicemos más de cerca cómo se comparan con un ejemplo.

Los modelos de visión artificial, como YOLO11, pueden entrenarse para detect y classify objetos en diversas aplicaciones del mundo real, como la inspección industrial. Pensemos en una cadena de montaje de una fábrica en la que diferentes piezas de una máquina se desplazan por una cinta transportadora. Algunas piezas pueden estar perfectamente colocadas, pero otras pueden estar ligeramente giradas, inclinadas o superpuestas debido a la vibración o la velocidad.

La detección de objetos tradicional utiliza cuadros rectangulares verticales que se alinean con los bordes horizontales y verticales de la imagen. Por lo tanto, cuando una pieza está girada, es posible que el cuadro no encaje correctamente: podría dejar fuera parte del objeto o incluir demasiado del fondo. Esto puede hacer que las detecciones sean menos precisas y más difíciles para que el sistema identifique la pieza con confianza.

Ahora, digamos que está utilizando la detección OBB en su lugar. En este caso, el modelo puede dibujar un cuadro que gira para coincidir con el ángulo exacto de cada parte. Un engranaje inclinado o un componente en ángulo estará estrechamente encerrado por un cuadro que se ajuste a su forma y dirección. Esto significa una mejor precisión, menos errores y resultados más fiables, especialmente con respecto a casos de uso como el control de calidad automatizado o la clasificación robótica.

Modelos populares de detección OBB

Ahora que tenemos una mejor comprensión de lo que es la detección OBB, echemos un vistazo a algunos de los modelos de Visión Artificial más utilizados que la soportan.

Se han desarrollado varios modelos avanzados de visión por ordenador específicamente para detectar objetos girados o inclinados. Entre ellos, los modelos Ultralytics YOLO son especialmente conocidos por su capacidad de detección fiable y eficaz de OBB.

Versiones anteriores como Ultralytics YOLOv5 estaban diseñadas para la detección de objetos estándar. Las iteraciones posteriores, como Ultralytics YOLOv8 y la más reciente YOLO11, introdujeron soporte nativo para la detección de OBB. YOLO11, en particular, ofrece una precisión de vanguardia sin comprometer la velocidad, lo que la convierte en una opción impactante para aplicaciones en tiempo real.

Los modelos OBB preentrenados YOLO11 , como obb, se entrenan en conjuntos de datos como DOTAv1, que consiste en imágenes aéreas anotadas con una serie de clases de objetos como aviones, barcos y pistas de tenis que aparecen en varios ángulos y orientaciones. 

Además, estos modelos están disponibles en cinco tamaños diferentes, desde nano (obb) hasta extragrande (obb), para adaptarse a las distintas necesidades de rendimiento. Esta versatilidad permite su aplicación en diversos sectores, desde la vigilancia de infraestructuras urbanas y la inspección de maquinaria hasta la lectura de texto sesgado en documentos escaneados.

Formación personalizada YOLO11 para la detección de recuadros delimitadores orientados

En muchas situaciones del mundo real, los objetos que debe detect pueden ser totalmente distintos de los que aparecen en los conjuntos de datos de entrenamiento estándar. Por ejemplo, objetos como herramientas en una línea de producción, paquetes de productos o componentes de una placa de circuitos pueden estar girados, colocados de forma irregular o tener una forma diferente. 

Para detect con precisión estos objetos personalizados, especialmente cuando la orientación es importante, es importante entrenar modelos como YOLO11 utilizando sus propias imágenes y etiquetas. Este proceso se conoce como entrenamiento personalizado

A continuación se explica paso a paso el proceso de entrenamiento de YOLO11 para la detección de OBB:

  • Recopilación de imágenes: Reúna imágenes que muestren sus objetos objetivo desde diferentes ángulos, posiciones y entornos del mundo real.
  • Anotación de objetos: Etiquete cada objeto utilizando cuadros delimitadores rotados (OBB) para capturar tanto su ubicación como su orientación utilizando herramientas de anotación con soporte OBB.
  • Preparación del conjunto de datos: Organice sus imágenes y etiquetas en la estructura de directorios YOLO y cree un archivo de configuración YAML con los nombres de las clases y las rutas de los conjuntos de datos.
  • Entrenamiento del modelo: Elige una versión del modelo YOLO11 que se ajuste a tus necesidades y ejecuta el proceso de entrenamiento para que el modelo pueda aprender de tus imágenes etiquetadas.
  • Evaluación e implementación: Pruebe su modelo entrenado en nuevas imágenes, evalúe su precisión e impleméntelo en aplicaciones prácticas como la fabricación, la vigilancia aérea o el análisis de documentos.

Aplicaciones habilitadas por la detección de OBB

Los objetos que están descentrados o inclinados son bastante comunes en escenarios de la vida real. Repasemos algunos ejemplos donde la detección OBB marca una diferencia real al detectar con precisión estos objetos.

Análisis de imágenes de rayos X mediante la detección de OBB

La detección OBB puede llevar el análisis de imágenes médicas un paso más allá al mejorar la precisión. Las imágenes médicas a menudo incluyen estructuras anatómicas como tumores, órganos o huesos. Estas estructuras a menudo aparecen en formas irregulares y orientaciones variadas. Dado que las OBB pueden rotar para coincidir con el ángulo de un objeto, proporcionan una localización y medición más precisas, lo cual es fundamental para el diagnóstico y la planificación del tratamiento.

Este enfoque es especialmente eficaz cuando se trata de analizar imágenes de rayos X de fracturas óseas, donde la posición y la alineación de los huesos son factores clave. Por ejemplo, la detección OBB se ha utilizado para analizar radiografías de codo pediátrico. Al ajustarse a la orientación de los huesos, ayudó a mejorar la precisión de la detección. 

__wf_reserved_inherit
Fig. 3. Radiografías (a, d) con detección de objetos (b, e) y detección de cajas delimitadoras orientadas (c, f).

Vigilancia aérea impulsada por la detección OBB

La vigilancia aérea es una herramienta esencial en sectores como la seguridad pública, la vigilancia medioambiental y la planificación urbana. Las imágenes captadas por drones o satélites pueden ayudar a identificar objetos como barcos, vehículos y edificios. Sin embargo, en estas imágenes los objetos suelen aparecer pequeños y en ángulos inusuales, lo que dificulta su detect precisa.

La detección OBB resuelve esto inclinando los cuadros delimitadores para que coincidan con el ángulo de cada objeto. Esto conduce a mediciones más precisas del tamaño y la orientación de un objeto, lo que permite una mejor toma de decisiones en áreas como la planificación urbana, la defensa, la respuesta a desastres y el monitoreo ambiental.

Un ejemplo interesante de detección de OBB es el seguimiento de barcos en la vigilancia marítima. Las imágenes de satélite a menudo capturan barcos en varios ángulos y tamaños debido al clima, la iluminación o el movimiento. Los OBB pueden adaptarse a estos cambios, mejorando la detección, especialmente para embarcaciones más pequeñas o parcialmente ocultas.

__wf_reserved_inherit
Fig. 4. Una mirada al uso de la detección OBB para la vigilancia marítima.

Uso de la detección OBB en la agricultura

Clasificar los cultivos después de la cosecha es un paso crucial para garantizar su calidad antes de envasarlos y enviarlos al mercado. Aunque muchos sistemas funcionan bien con frutas redondas como manzanas y naranjas, los cultivos largos y estrechos, como las zanahorias o los brotes de Zizania, pueden ser mucho más difíciles de manejar. Sus formas varían y a menudo terminan en ángulos diferentes, lo que dificulta su detect y clasificación precisas.

Para solucionar este problema, los investigadores han desarrollado un sistema que utiliza la detección de cajas delimitadoras orientadas (OBB) para identificar y clasificar estos cultivos con mayor precisión. El sistema puede detect varios cultivos en una imagen, aunque estén inclinados o se solapen, y evaluar su calidad y posición en tiempo real.

Pros y contras de la detección OBB

Estos son algunos de los beneficios de usar la detección OBB:

  • Entrada mejorada para tareas posteriores: Las tareas de visión artificial como la segmentación de instancias y el seguimiento de objetos pueden funcionar mejor cuando se les proporcionan detecciones de objetos más precisas.

  • Razonamiento espacial mejorado: Al capturar el ángulo de orientación, los OBB permiten comprender la alineación y la dirección de un objeto.

  • Superposición reducida en escenas concurridas: Los OBB reducen la ambigüedad al ajustar los objetos de forma más precisa, incluso en escenas ocupadas o desordenadas.

A pesar de ayudar a mejorar la precisión de la detección en escenas complejas, la detección OBB presenta algunas limitaciones a tener en cuenta:

  • Mayor sensibilidad al ruido: Los pequeños errores en la predicción del ángulo pueden tener un mayor impacto en la precisión de la detección, especialmente para objetos muy juntos o alargados.
  • Se requieren herramientas especializadas: Dado que no todas las plataformas de etiquetado y entrenamiento admiten de forma nativa las OBB, trabajar con ellas puede requerir herramientas o configuraciones adicionales.

  • Disponibilidad limitada de conjuntos de datos: En comparación con la detección de objetos estándar, actualmente hay menos conjuntos de datos disponibles públicamente con anotaciones OBB, lo que puede dificultar un poco el inicio o la comparación de resultados.

Conclusiones clave

La detección de cajas delimitadoras orientadas facilita que las soluciones de visión artificial reconozcan objetos que no están perfectamente rectos o alineados. Al capturar tanto la posición como la orientación de los objetos, la detección OBB aumenta la precisión en casos de uso del mundo real, como el escaneo de imágenes médicas, el monitoreo de tierras de cultivo o el análisis de fotos satelitales.

Con modelos como YOLO11 , la detección de OBB es cada vez más accesible y se está convirtiendo en una opción práctica para muchos sectores. Tanto si se trata de objetos inclinados, superpuestos o con formas extrañas, la detección de OBB añade una capa adicional de precisión que los métodos estándar suelen pasar por alto.

¿Tiene curiosidad por la IA? Explore nuestro repositorio de GitHub, conéctese con nuestra comunidad y consulte nuestras opciones de licencia para impulsar su proyecto de visión artificial. Obtenga más información sobre innovaciones como la IA en el comercio minorista y la visión artificial en la industria de la logística en nuestras páginas de soluciones.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis