¿Qué es la detección de recuadros delimitadores orientados (OBB)?

5 minutos de lectura

9 de junio de 2025

Explore cómo la detección de cajas delimitadoras orientadas (OBB) mejora la detección de objetos mediante la identificación precisa de objetos rotados en imágenes a través de aplicaciones del mundo real.

Reconocer objetos, independientemente de cómo estén dispuestos o de hacia dónde miren, es algo natural para nosotros como humanos. Tanto si se trata de coches en un cruce como de barcos en un puerto, podemos decir fácilmente qué son y en qué dirección apuntan. Sin embargo, para los sistemas de inteligencia artificial (IA) no es tan sencillo.

Por ejemplo, la visión por ordenador, una rama de la IA centrada en la comprensión de imágenes y vídeos, permite realizar tareas como la detección de objetos, que ayuda a las máquinas a identificar y localizar objetos dentro de una escena. La detección de objetos tradicional se basa en cuadros delimitadores alineados con los ejes para dibujar recuadros alrededor de los objetos. Estos recuadros tienen lados rectos y ángulos rectos fijos. Este método funciona bien cuando los objetos están en posición vertical y no demasiado juntos. 

Pero cuando los objetos están inclinados, girados o muy juntos, la detección tradicional de objetos suele tener dificultades para captarlos con precisión. Para hacer frente a estas situaciones más complejas, se han introducido técnicas como la detección de cajas delimitadoras orientadas (OBB ). A diferencia de los cuadros delimitadores estándar, los OBB pueden girar para adaptarse al ángulo y la forma del objeto, lo que permite un ajuste más preciso.

Los modelos de visión artificial como Ultralytics YOLO11, que admiten la detección de OBB, permiten una serie de aplicaciones en tiempo real, especialmente en escenarios en los que la orientación del objeto es importante, como la vigilancia aérea. Además, la detección de OBB también se utiliza en la sanidad, la agricultura y el análisis de documentos.

En este artículo, exploraremos qué es la detección OBB, cómo funciona y dónde se está aplicando en escenarios del mundo real. Empecemos.

__wf_reserved_inherit
Fig. 1. Ejemplo de demostración del uso de YOLO11 para la detección de OBB en embarcaciones.

¿Qué es un cuadro delimitador orientado?

Un cuadro delimitador orientado es un tipo de cuadro rectangular utilizado en visión por ordenador para representar objetos detectados en una imagen. Mientras que los cuadros delimitadores estándar se alinean con los ejes horizontal y vertical de la imagen, los OBB pueden girar para adaptarse al ángulo real del objeto.

Esta capacidad de rotación aporta varias ventajas. Los OBB pueden alinearse más estrechamente con la orientación de un objeto, lo que permite que la caja se ajuste a la forma y dirección del objeto. Como resultado, la detección es más exacta y precisa.

Los OBB son especialmente útiles cuando los objetos no están perfectamente erguidos, como un coche que gira en una carretera curva en imágenes aéreas, un libro inclinado sobre un escritorio o un tumor girado en una exploración médica. Al adaptarse con mayor precisión al ángulo de un objeto, los OBB mejoran el rendimiento de la detección, reducen las interferencias de fondo y son especialmente útiles en aplicaciones en las que la orientación de un objeto es tan importante como su posición.

__wf_reserved_inherit
Fig. 2. Comparación de la detección de objetos y la detección de OBB.

Detección de OBB frente a detección de objetos

La detección OBB y la detección de objetos tradicional pueden parecer similares a primera vista, pero se utilizan de diferentes maneras y para diferentes situaciones. Veamos cómo se comparan con un ejemplo.

Los modelos de visión artificial, como YOLO11, pueden entrenarse para detectar y clasificar objetos en diversas aplicaciones del mundo real, como la inspección industrial. Pensemos en una cadena de montaje de una fábrica en la que diferentes piezas de una máquina se desplazan por una cinta transportadora. Algunas piezas pueden estar perfectamente colocadas, pero otras pueden estar ligeramente giradas, inclinadas o superpuestas debido a la vibración o la velocidad.

La detección de objetos tradicional utiliza recuadros rectangulares verticales que se alinean con los bordes horizontales y verticales de la imagen. Por eso, cuando se gira una pieza, es posible que el recuadro no se ajuste correctamente: podría dejar fuera parte del objeto o incluir demasiado del fondo. Esto puede hacer que las detecciones sean menos precisas y que al sistema le resulte más difícil identificar la pieza con seguridad.

Supongamos que utiliza la detección OBB. En este caso, el modelo puede dibujar una caja que gire para coincidir con el ángulo exacto de cada pieza. Un engranaje inclinado o un componente en ángulo quedarán estrechamente encerrados por una caja que se ajuste a su forma y dirección. Esto se traduce en una mayor precisión, menos errores y resultados más fiables, sobre todo en casos de uso como el control de calidad automatizado o la clasificación robótica.

Modelos populares de detección de OBB

Ahora que entendemos mejor qué es la detección de OBB, echemos un vistazo a algunos de los modelos de Vision AI más utilizados que la soportan.

Se han desarrollado varios modelos avanzados de visión por ordenador específicamente para detectar objetos girados o inclinados. Entre ellos, los modelos Ultralytics YOLO son especialmente conocidos por su capacidad de detección fiable y eficaz de OBB.

Las versiones anteriores, como Ultralytics YOLOv5, se diseñaron para la detección de objetos estándar. Las iteraciones posteriores, como Ultralytics YOLOv8 y la más reciente YOLO11, introdujeron soporte nativo para la detección de OBB. YOLO11, en particular, ofrece una precisión de vanguardia sin comprometer la velocidad, lo que lo convierte en una opción impactante para aplicaciones en tiempo real.

Los modelos OBB preentrenados de YOLO11, como YOLO11n-obb, se entrenan en conjuntos de datos como DOTAv1, que consiste en imágenes aéreas anotadas con una serie de clases de objetos como aviones, barcos y pistas de tenis que aparecen en varios ángulos y orientaciones. 

Además, estos modelos están disponibles en cinco tamaños diferentes, desde nano (n-obb) hasta extragrande (x-obb), para adaptarse a las distintas necesidades de rendimiento. Esta versatilidad permite su aplicación en diversos sectores, desde la vigilancia de infraestructuras urbanas y la inspección de maquinaria hasta la lectura de texto sesgado en documentos escaneados.

Formación personalizada YOLO11 para la detección de recuadros delimitadores orientados

En muchas situaciones del mundo real, los objetos que debe detectar pueden ser totalmente distintos de los que aparecen en los conjuntos de datos de entrenamiento estándar. Por ejemplo, objetos como herramientas en una línea de producción, paquetes de productos o componentes de una placa de circuitos pueden estar girados, colocados de forma irregular o tener una forma diferente. 

Para detectar con precisión estos objetos personalizados, especialmente cuando la orientación es importante, es importante entrenar modelos como YOLO11 utilizando sus propias imágenes y etiquetas. Este proceso se conoce como entrenamiento personalizado

A continuación se describe paso a paso el proceso de entrenamiento de YOLO11 para la detección de OBB:

  • Recopilación de imágenes: Reúne imágenes que muestren tus objetos objetivo desde distintos ángulos, posiciones y entornos del mundo real.
  • Anotación de objetos: Etiquete cada objeto mediante cuadros delimitadores rotados (OBB) para capturar tanto su ubicación como su orientación utilizando herramientas de anotación compatibles con OBB.
  • Preparación del conjunto de datos: Organice sus imágenes y etiquetas en la estructura de directorios de YOLO y cree un archivo de configuración YAML con los nombres de las clases y las rutas de los conjuntos de datos.
  • Entrenamiento del modelo: Elige una versión del modelo YOLO11 que se ajuste a tus necesidades y ejecuta el proceso de entrenamiento para que el modelo pueda aprender de tus imágenes etiquetadas.
  • Evaluación y despliegue: Pruebe su modelo entrenado con nuevas imágenes, evalúe su precisión y despliéguelo en aplicaciones prácticas como la fabricación, la vigilancia aérea o el análisis de documentos.

Aplicaciones habilitadas por la detección de OBB

Los objetos descentrados o inclinados son bastante comunes en la vida real. Veamos algunos ejemplos en los que la detección de OBB marca la diferencia al detectar con precisión estos objetos.

Análisis de imágenes de rayos X mediante detección de OBB

La detección de OBB puede llevar el análisis de imágenes médicas un paso más allá al mejorar la precisión. Las imágenes médicas suelen incluir estructuras anatómicas como tumores, órganos o huesos. Estas estructuras suelen aparecer con formas irregulares y orientaciones variadas. Dado que los OBB pueden girar para adaptarse al ángulo de un objeto, proporcionan una localización y medición más precisas, lo que es fundamental para el diagnóstico y la planificación del tratamiento.

Este enfoque es especialmente eficaz cuando se trata de analizar radiografías de fracturas óseas, en las que la posición y la alineación de los huesos son factores clave. Por ejemplo, la detección OBB se ha utilizado para analizar radiografías pediátricas de codo. Al ajustarse a la orientación de los huesos, ayudó a mejorar la precisión de la detección. 

__wf_reserved_inherit
Fig. 3. Radiografías (a, d) con detección de objetos (b, e) y detección de cajas delimitadoras orientadas (c, f).

Vigilancia aérea mediante detección de OBB

La vigilancia aérea es una herramienta esencial en sectores como la seguridad pública, la vigilancia medioambiental y la planificación urbana. Las imágenes captadas por drones o satélites pueden ayudar a identificar objetos como barcos, vehículos y edificios. Sin embargo, en estas imágenes los objetos suelen aparecer pequeños y en ángulos inusuales, lo que dificulta su detección precisa.

La detección OBB resuelve este problema inclinando los cuadros delimitadores para que coincidan con el ángulo de cada objeto. Así se obtienen mediciones más precisas del tamaño y la orientación de un objeto, lo que permite tomar mejores decisiones en ámbitos como la planificación urbana, la defensa, la respuesta ante catástrofes y la vigilancia del medio ambiente.

Un ejemplo interesante de detección OBB es el seguimiento de buques en la vigilancia marítima. Las imágenes de satélite suelen captar buques en ángulos y tamaños variables debido a las condiciones meteorológicas, la iluminación o el movimiento. Los OBB pueden adaptarse a estos cambios y mejorar la detección, sobre todo de los buques más pequeños o parcialmente ocultos.

__wf_reserved_inherit
Fig. 4. Un vistazo al uso de la detección OBB para la vigilancia marítima.

Detección de OBB en la agricultura

Clasificar los cultivos después de la cosecha es un paso crucial para garantizar su calidad antes de envasarlos y enviarlos al mercado. Aunque muchos sistemas funcionan bien con frutas redondas como manzanas y naranjas, los cultivos largos y estrechos, como las zanahorias o los brotes de Zizania, pueden ser mucho más difíciles de manejar. Sus formas varían y a menudo terminan en ángulos diferentes, lo que dificulta su detección y clasificación precisas.

Para solucionar este problema, los investigadores han desarrollado un sistema que utiliza la detección de cajas delimitadoras orientadas (OBB) para identificar y clasificar estos cultivos con mayor precisión. El sistema puede detectar varios cultivos en una imagen, aunque estén inclinados o se solapen, y evaluar su calidad y posición en tiempo real.

Ventajas e inconvenientes de la detección de OBB

Estas son algunas de las ventajas de utilizar la detección OBB:

  • Mejora de las tareas posteriores: Lastareas de visión por ordenador, como la segmentación de instancias y el seguimiento de objetos, pueden rendir mejor si reciben detecciones de objetos más precisas.

  • Mejora del razonamiento espacial: Al captar el ángulo de orientación, los OBB permiten comprender la alineación y dirección de un objeto.

  • Reducción del solapamiento en escenas abarrotadas: Los OBB reducen la ambigüedad al ajustar mejor los objetos, incluso en escenas concurridas o desordenadas.

A pesar de ayudar a mejorar la precisión de la detección en escenas complejas, la detección de OBB presenta algunas limitaciones a tener en cuenta:

  • Mayor sensibilidad al ruido: Los pequeños errores en la predicción de ángulos pueden tener un mayor impacto en la precisión de la detección, especialmente en el caso de objetos muy juntos o alargados.
  • Se necesitan herramientas especializadas: Como no todas las plataformas de etiquetado y formación admiten OBB de forma nativa, trabajar con ellos puede requerir herramientas o configuraciones adicionales.

  • Disponibilidad limitada de conjuntos de datos: En comparación con la detección de objetos estándar, actualmente hay menos conjuntos de datos disponibles públicamente con anotaciones OBB, lo que puede hacer que sea un poco más difícil empezar o comparar resultados.

Principales conclusiones

La detección de recuadros delimitadores orientados facilita a las soluciones de visión por ordenador el reconocimiento de objetos que no están perfectamente rectos o alineados. Al capturar tanto la posición como la orientación de los objetos, la detección de OBB aumenta la precisión en casos de uso real como el escaneado de imágenes médicas, la supervisión de tierras de cultivo o el análisis de fotos de satélite.

Con modelos como YOLO11, la detección de OBB es cada vez más accesible y se está convirtiendo en una opción práctica para muchos sectores. Tanto si se trata de objetos inclinados, superpuestos o con formas extrañas, la detección de OBB añade una capa adicional de precisión que los métodos estándar suelen pasar por alto.

¿Siente curiosidad por la IA? Explore nuestro repositorio de GitHub, conecte con nuestra comunidad y consulte nuestras opciones de licencia para poner en marcha su proyecto de visión por ordenador. Obtenga más información sobre innovaciones como la IA en el comercio minorista y la visión por ordenador en el sector logístico en nuestras páginas de soluciones.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Empezar gratis
Enlace copiado en el portapapeles