¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024

¿Qué es la detección de cajas delimitadoras orientadas (OBB)?

5 minutos de lectura

9 de junio de 2025

Descubra cómo la detección de cajas delimitadoras orientadas (OBB) mejora la detección de objetos al identificar con precisión objetos rotados en imágenes en aplicaciones del mundo real.

Reconocer objetos, independientemente de cómo estén dispuestos o hacia dónde estén orientados, es algo natural para nosotros como humanos. Ya sean coches en una intersección o barcos en un puerto, podemos decir fácilmente qué son y hacia dónde apuntan. Sin embargo, para los sistemas de inteligencia artificial (IA), no es tan sencillo.

Por ejemplo, la visión artificial, una rama de la IA centrada en la comprensión de imágenes y vídeos, permite tareas como la detección de objetos, que ayuda a las máquinas a identificar y localizar objetos dentro de una escena. La detección de objetos tradicional se basa en cajas delimitadoras alineadas con los ejes para dibujar cajas alrededor de los objetos. Estas cajas tienen lados rectos y ángulos rectos fijos. Este enfoque funciona bien cuando los objetos están verticales y no demasiado juntos. 

Pero cuando los objetos están inclinados, rotados o muy juntos, la detección de objetos tradicional a menudo tiene dificultades para capturarlos con precisión. Para manejar estas situaciones más complejas, se han introducido técnicas como la detección de cajas delimitadoras orientadas (OBB). A diferencia de las cajas delimitadoras estándar, las OBB pueden rotar para coincidir con el ángulo y la forma del objeto, lo que permite un ajuste más preciso.

Los modelos de visión artificial como Ultralytics YOLO11, que admiten la detección OBB, permiten una variedad de aplicaciones en tiempo real, especialmente en escenarios donde la orientación de los objetos es importante, como la vigilancia aérea. Más allá de eso, la detección OBB también se utiliza en la atención médica, la agricultura y el análisis de documentos.

En este artículo, exploraremos qué es la detección OBB, cómo funciona y dónde se está aplicando en escenarios del mundo real. ¡Empecemos!

__wf_reserved_inherit
Fig. 1. Un ejemplo de demostración del uso de YOLO11 para la detección OBB de barcos.

¿Qué es un bounding box orientado?

Un bounding box orientado es un tipo de caja rectangular utilizada en visión artificial para representar objetos detectados en una imagen. Mientras que los bounding boxes estándar están alineados con los ejes horizontal y vertical de la imagen, los OBB pueden rotar para coincidir con el ángulo real del objeto.

Esta capacidad de rotar aporta varias ventajas. Las OBB pueden alinearse más estrechamente con la orientación de un objeto, lo que permite que la caja se ajuste perfectamente a la forma y dirección del objeto. Como resultado, la detección se vuelve más precisa.

Las OBB son especialmente útiles cuando los objetos no están perfectamente verticales, como un automóvil que gira en una carretera curva en imágenes aéreas, un libro inclinado sobre un escritorio o un tumor rotado en una exploración médica. Al coincidir con el ángulo de un objeto con mayor precisión, las OBB mejoran el rendimiento de la detección, reducen la interferencia del fondo y son particularmente excelentes para aplicaciones donde la orientación de un objeto importa tanto como su posición.

__wf_reserved_inherit
Fig. 2. Comparación entre la detección de objetos y la detección de OBB.

Detección OBB vs. detección de objetos

La detección OBB y la detección de objetos tradicional pueden parecer similares al principio, pero se utilizan de diferentes maneras y para diferentes situaciones. Analicemos más de cerca cómo se comparan con un ejemplo.

Los modelos de visión artificial, como YOLO11, se pueden entrenar para detectar y clasificar objetos en diversas aplicaciones del mundo real, como la inspección industrial. Considere una línea de montaje de fábrica donde diferentes piezas de la máquina se mueven a lo largo de una cinta transportadora. Algunas piezas pueden estar colocadas cuidadosamente, pero otras pueden estar ligeramente rotadas, inclinadas o superpuestas debido a la vibración o la velocidad.

La detección de objetos tradicional utiliza cuadros rectangulares verticales que se alinean con los bordes horizontales y verticales de la imagen. Por lo tanto, cuando una pieza está girada, es posible que el cuadro no encaje correctamente: podría dejar fuera parte del objeto o incluir demasiado del fondo. Esto puede hacer que las detecciones sean menos precisas y más difíciles para que el sistema identifique la pieza con confianza.

Ahora, digamos que está utilizando la detección OBB en su lugar. En este caso, el modelo puede dibujar un cuadro que gira para coincidir con el ángulo exacto de cada parte. Un engranaje inclinado o un componente en ángulo estará estrechamente encerrado por un cuadro que se ajuste a su forma y dirección. Esto significa una mejor precisión, menos errores y resultados más fiables, especialmente con respecto a casos de uso como el control de calidad automatizado o la clasificación robótica.

Modelos populares de detección OBB

Ahora que tenemos una mejor comprensión de lo que es la detección OBB, echemos un vistazo a algunos de los modelos de Visión Artificial más utilizados que la soportan.

Se han desarrollado varios modelos avanzados de visión artificial específicamente para detectar objetos rotados o inclinados. Entre ellos, los modelos Ultralytics YOLO son particularmente conocidos por sus capacidades de detección de OBB fiables y eficientes.

Las versiones anteriores como Ultralytics YOLOv5 fueron diseñadas para la detección de objetos estándar. Las iteraciones posteriores, como Ultralytics YOLOv8 y el más reciente YOLO11, introdujeron soporte nativo para la detección OBB. YOLO11, en particular, ofrece una precisión de última generación sin comprometer la velocidad, lo que la convierte en una opción impactante para aplicaciones en tiempo real.

Los modelos YOLO11 OBB preentrenados, como YOLO11n-obb, se entrenan en conjuntos de datos como DOTAv1, que consta de imágenes aéreas anotadas con una variedad de clases de objetos como aviones, barcos y canchas de tenis que aparecen en varios ángulos y orientaciones. 

Además, estos modelos están disponibles en cinco tamaños diferentes, desde nano (n-obb) hasta extra grande (x-obb), para satisfacer diferentes necesidades de rendimiento. Esta versatilidad permite aplicarlos en diversos sectores, desde la monitorización de infraestructuras urbanas y la inspección de maquinaria hasta la lectura de texto inclinado en documentos escaneados.

Entrenamiento personalizado de YOLO11 para la detección de cajas delimitadoras orientadas

En muchas situaciones del mundo real, los objetos que necesitas detectar pueden ser completamente diferentes de los que se encuentran en los conjuntos de datos de entrenamiento estándar. Por ejemplo, objetos como herramientas en una línea de producción, paquetes de productos o componentes en una placa de circuito pueden estar rotados, colocados irregularmente o tener formas diferentes. 

Para detectar con precisión estos objetos personalizados, especialmente cuando la orientación importa, es importante entrenar modelos como YOLO11 utilizando tus propias imágenes y etiquetas. Este proceso se conoce como entrenamiento personalizado

Aquí tiene un análisis más detallado del proceso paso a paso para entrenar YOLO11 para la detección de OBB:

  • Recopilación de imágenes: Reúna imágenes que muestren sus objetos objetivo desde diferentes ángulos, posiciones y entornos del mundo real.
  • Anotación de objetos: Etiquete cada objeto utilizando cuadros delimitadores rotados (OBB) para capturar tanto su ubicación como su orientación utilizando herramientas de anotación con soporte OBB.
  • Preparación del dataset: Organiza tus imágenes y etiquetas en la estructura de directorios YOLO y crea un archivo de configuración YAML con los nombres de tus clases y las rutas del dataset.
  • Entrenamiento del modelo: Elija una versión del modelo YOLO11 que se ajuste a sus necesidades y ejecute el proceso de entrenamiento para que el modelo pueda aprender de sus imágenes etiquetadas.
  • Evaluación e implementación: Pruebe su modelo entrenado en nuevas imágenes, evalúe su precisión e impleméntelo en aplicaciones prácticas como la fabricación, la vigilancia aérea o el análisis de documentos.

Aplicaciones habilitadas por la detección de OBB

Los objetos que están descentrados o inclinados son bastante comunes en escenarios de la vida real. Repasemos algunos ejemplos donde la detección OBB marca una diferencia real al detectar con precisión estos objetos.

Análisis de imágenes de rayos X mediante la detección de OBB

La detección OBB puede llevar el análisis de imágenes médicas un paso más allá al mejorar la precisión. Las imágenes médicas a menudo incluyen estructuras anatómicas como tumores, órganos o huesos. Estas estructuras a menudo aparecen en formas irregulares y orientaciones variadas. Dado que las OBB pueden rotar para coincidir con el ángulo de un objeto, proporcionan una localización y medición más precisas, lo cual es fundamental para el diagnóstico y la planificación del tratamiento.

Este enfoque es especialmente eficaz cuando se trata de analizar imágenes de rayos X de fracturas óseas, donde la posición y la alineación de los huesos son factores clave. Por ejemplo, la detección OBB se ha utilizado para analizar radiografías de codo pediátrico. Al ajustarse a la orientación de los huesos, ayudó a mejorar la precisión de la detección. 

__wf_reserved_inherit
Fig. 3. Radiografías (a, d) con detección de objetos (b, e) y detección de cajas delimitadoras orientadas (c, f).

Vigilancia aérea impulsada por la detección OBB

La vigilancia aérea es una herramienta esencial en sectores como la seguridad pública, la monitorización ambiental y la planificación urbana. Las imágenes capturadas por drones o satélites pueden ayudar a identificar objetos como barcos, vehículos y edificios. Sin embargo, en estas imágenes, los objetos a menudo aparecen pequeños y en ángulos inusuales, lo que dificulta su detección precisa.

La detección OBB resuelve esto inclinando los cuadros delimitadores para que coincidan con el ángulo de cada objeto. Esto conduce a mediciones más precisas del tamaño y la orientación de un objeto, lo que permite una mejor toma de decisiones en áreas como la planificación urbana, la defensa, la respuesta a desastres y el monitoreo ambiental.

Un ejemplo interesante de detección de OBB es el seguimiento de barcos en la vigilancia marítima. Las imágenes de satélite a menudo capturan barcos en varios ángulos y tamaños debido al clima, la iluminación o el movimiento. Los OBB pueden adaptarse a estos cambios, mejorando la detección, especialmente para embarcaciones más pequeñas o parcialmente ocultas.

__wf_reserved_inherit
Fig. 4. Una mirada al uso de la detección OBB para la vigilancia marítima.

Uso de la detección OBB en la agricultura

La clasificación de los cultivos después de la cosecha es un paso crucial para garantizar la calidad antes de empaquetarlos y enviarlos al mercado. Si bien muchos sistemas funcionan bien para frutas redondas como manzanas y naranjas, los cultivos largos y estrechos, como las zanahorias o los brotes de Zizania, pueden ser mucho más difíciles de manipular. Sus formas varían y, a menudo, terminan en diferentes ángulos, lo que dificulta su detección y clasificación precisas.

Para abordar esto, los investigadores han desarrollado un sistema que utiliza la detección de cajas delimitadoras orientadas (OBB) para identificar y calificar estos cultivos con mayor precisión. El sistema puede detectar múltiples cultivos en una imagen, incluso si están inclinados o superpuestos, y evaluar su calidad y posición en tiempo real.

Pros y contras de la detección OBB

Estos son algunos de los beneficios de usar la detección OBB:

  • Entrada mejorada para tareas posteriores: Las tareas de visión artificial como la segmentación de instancias y el seguimiento de objetos pueden funcionar mejor cuando se les proporcionan detecciones de objetos más precisas.

  • Razonamiento espacial mejorado: Al capturar el ángulo de orientación, los OBB permiten comprender la alineación y la dirección de un objeto.

  • Superposición reducida en escenas concurridas: Los OBB reducen la ambigüedad al ajustar los objetos de forma más precisa, incluso en escenas ocupadas o desordenadas.

A pesar de ayudar a mejorar la precisión de la detección en escenas complejas, la detección OBB presenta algunas limitaciones a tener en cuenta:

  • Mayor sensibilidad al ruido: Los pequeños errores en la predicción del ángulo pueden tener un mayor impacto en la precisión de la detección, especialmente para objetos muy juntos o alargados.
  • Se requieren herramientas especializadas: Dado que no todas las plataformas de etiquetado y entrenamiento admiten de forma nativa las OBB, trabajar con ellas puede requerir herramientas o configuraciones adicionales.

  • Disponibilidad limitada de conjuntos de datos: En comparación con la detección de objetos estándar, actualmente hay menos conjuntos de datos disponibles públicamente con anotaciones OBB, lo que puede dificultar un poco el inicio o la comparación de resultados.

Conclusiones clave

La detección de cajas delimitadoras orientadas facilita que las soluciones de visión artificial reconozcan objetos que no están perfectamente rectos o alineados. Al capturar tanto la posición como la orientación de los objetos, la detección OBB aumenta la precisión en casos de uso del mundo real, como el escaneo de imágenes médicas, el monitoreo de tierras de cultivo o el análisis de fotos satelitales.

Con modelos como YOLO11 que hacen que la detección de OBB sea más accesible, se está convirtiendo en una opción práctica para muchas industrias. Ya sea que esté tratando con objetos inclinados, superpuestos o con formas extrañas, la detección de OBB agrega una capa adicional de precisión que los métodos estándar a menudo no alcanzan.

¿Tiene curiosidad por la IA? Explore nuestro repositorio de GitHub, conéctese con nuestra comunidad y consulte nuestras opciones de licencia para impulsar su proyecto de visión artificial. Obtenga más información sobre innovaciones como la IA en el comercio minorista y la visión artificial en la industria de la logística en nuestras páginas de soluciones.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis
Enlace copiado al portapapeles