Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Guías

¿Qué es la detección de cajas delimitadoras orientadas (OBB)?

Explora cómo la detección de cajas delimitadoras orientadas (OBB) mejora la detección de objetos al identificar con precisión objetos rotados en imágenes en aplicaciones del mundo real.

NUNuvola Ladi
5 min read
Detección de cajas delimitadoras orientadas (OBB) de objetos rotados

Reconocer objetos, independientemente de cómo estén dispuestos o hacia dónde miren, es algo natural para nosotros como humanos. Ya sean coches en un cruce o barcos en un puerto, podemos saber fácilmente qué son y hacia dónde apuntan. Sin embargo, para los sistemas de inteligencia artificial (IA), no es tan sencillo.

Por ejemplo, la visión artificial, una rama de la IA centrada en la comprensión de imágenes y vídeos, permite realizar tareas como la detección de objetos, que ayuda a las máquinas a identificar y localizar objetos dentro de una escena. La detección de objetos tradicional se basa en cuadros delimitadores alineados con los ejes para rodear los objetos. Estos cuadros tienen lados rectos y ángulos rectos fijos. Este enfoque funciona bien cuando los objetos están en posición vertical y no están demasiado juntos.

Pero cuando los objetos están inclinados, rotados o muy juntos, la detección de objetos tradicional suele tener dificultades para captarlos con precisión. Para manejar estas situaciones más complejas, se han introducido técnicas como la detección mediante cuadros delimitadores orientados (OBB). A diferencia de los cuadros delimitadores estándar, los OBB pueden rotar para ajustarse al ángulo y la forma del objeto, lo que permite un ajuste más preciso y ceñido.

Los modelos de visión artificial como Ultralytics YOLO11, que admiten la detección OBB, permiten una amplia gama de aplicaciones en tiempo real, especialmente en escenarios donde la orientación del objeto es importante, como la vigilancia aérea. Más allá de eso, la detección OBB también se utiliza en la sanidad, la agricultura y el análisis de documentos.

En este artículo, exploraremos qué es la detección OBB, cómo funciona y dónde se está aplicando en escenarios del mundo real. ¡Empecemos!

Uso de YOLO11 para la detección OBB de barcos

Fig 1. Una demostración de ejemplo del uso de YOLO11 para la detección OBB de barcos.

Link to this section¿Qué es un cuadro delimitador orientado?#

Un cuadro delimitador orientado es un tipo de cuadro rectangular utilizado en visión artificial para representar objetos detectados en una imagen. Mientras que los cuadros delimitadores estándar están alineados con los ejes horizontal y vertical de la imagen, los OBB pueden rotar para coincidir con el ángulo real del objeto.

Esta capacidad de rotación aporta varias ventajas. Los OBB pueden alinearse más estrechamente con la orientación de un objeto, lo que permite que el cuadro se ajuste ceñidamente a la forma y dirección del objeto. Como resultado, la detección se vuelve más precisa y exacta.

Los OBB son especialmente útiles cuando los objetos no están perfectamente verticales, como un coche girando en una carretera curva en imágenes aéreas, un libro inclinado sobre un escritorio o un tumor rotado en una exploración médica. Al ajustar el ángulo de un objeto con mayor precisión, los OBB mejoran el rendimiento de la detección, reducen la interferencia del fondo y son particularmente excelentes para aplicaciones donde la orientación de un objeto importa tanto como su posición.

Comparación entre la detección de objetos y la detección OBB

Fig 2. Comparación entre la detección de objetos y la detección OBB.

Link to this sectionDetección OBB frente a la detección de objetos#

La detección OBB y la detección de objetos tradicional pueden parecer similares al principio, pero se utilizan de formas diferentes y para situaciones distintas. Veamos más de cerca cómo se comparan con un ejemplo.

Los modelos de visión artificial, como YOLO11, pueden entrenarse para detectar y clasificar objetos en diversas aplicaciones del mundo real, como la inspección industrial. Considera una línea de montaje de fábrica donde diferentes piezas de máquina se mueven a lo largo de una cinta transportadora. Algunas piezas pueden estar colocadas cuidadosamente, pero otras pueden estar ligeramente rotadas, inclinadas o superpuestas debido a la vibración o la velocidad.

La detección de objetos tradicional utiliza cuadros rectangulares verticales que se alinean con los bordes horizontales y verticales de la imagen. Por lo tanto, cuando una pieza está rotada, el cuadro puede no ajustarse correctamente: podría dejar fuera parte del objeto o incluir demasiado fondo. Esto puede hacer que las detecciones sean menos precisas y más difíciles de identificar con seguridad para el sistema.

Ahora, digamos que usas la detección OBB en su lugar. En este caso, el modelo puede dibujar un cuadro que rota para coincidir con el ángulo exacto de cada pieza. Un engranaje inclinado o un componente en ángulo quedarán encerrados firmemente por un cuadro que se ajusta a su forma y dirección. Esto significa mejor precisión, menos errores y resultados más fiables, especialmente con respecto a casos de uso como el control de calidad automatizado o la clasificación robótica.

Link to this sectionModelos populares de detección OBB#

Ahora que tenemos una mejor comprensión de qué es la detección OBB, echemos un vistazo a algunos de los modelos de IA de visión más utilizados que la admiten.

Se han desarrollado varios modelos avanzados de visión artificial específicamente para detectar objetos rotados o inclinados. Entre ellos, los modelos Ultralytics YOLO son particularmente conocidos por sus capacidades de detección OBB fiables y eficientes.

Versiones anteriores como Ultralytics YOLOv5 fueron diseñadas para la detección de objetos estándar. Iteraciones posteriores, como Ultralytics YOLOv8 y el más reciente YOLO11, introdujeron soporte nativo para la detección OBB. YOLO11, en particular, ofrece una precisión de vanguardia sin comprometer la velocidad, lo que lo convierte en una opción impactante para aplicaciones en tiempo real.

Los modelos YOLO11 OBB preentrenados, como YOLO11n-obb, están entrenados en conjuntos de datos como DOTAv1, que consta de imágenes aéreas anotadas con una variedad de clases de objetos como aviones, barcos y canchas de tenis que aparecen en varios ángulos y orientaciones.

Además, estos modelos están disponibles en cinco tamaños diferentes, desde nano (n-obb) hasta extragrande (x-obb), para adaptarse a diferentes necesidades de rendimiento. Esta versatilidad les permite aplicarse en diversas industrias, desde la monitorización de infraestructura urbana y la inspección de maquinaria hasta la lectura de texto sesgado en documentos escaneados.

Link to this sectionEntrenamiento personalizado de YOLO11 para la detección mediante cuadros delimitadores orientados#

En muchas situaciones del mundo real, los objetos que necesitas detectar pueden ser completamente diferentes de los que se encuentran en los conjuntos de datos de entrenamiento estándar. Por ejemplo, objetos como herramientas en una línea de producción, paquetes de productos o componentes en una placa de circuito pueden estar rotados, colocados de forma irregular o tener formas diferentes.

Para detectar con precisión estos objetos personalizados, especialmente cuando la orientación importa, es importante entrenar modelos como YOLO11 utilizando tus propias imágenes y etiquetas. Este proceso se conoce como entrenamiento personalizado.

Aquí tienes un vistazo más de cerca al proceso paso a paso para entrenar YOLO11 para la detección OBB:

  • Recopilación de imágenes: Reúne imágenes que muestren tus objetos objetivo desde diferentes ángulos, posiciones y entornos del mundo real.
  • Anotación de objetos: Etiqueta cada objeto usando cuadros delimitadores rotados (OBB) para capturar tanto su ubicación como su orientación utilizando herramientas de anotación con soporte OBB.
  • Preparación del conjunto de datos: Organiza tus imágenes y etiquetas en la estructura de directorios de YOLO y crea un archivo de configuración YAML con tus nombres de clase y rutas del conjunto de datos.
  • Entrenamiento del modelo: Elige una versión del modelo YOLO11 que se ajuste a tus necesidades y ejecuta el proceso de entrenamiento para que el modelo pueda aprender de tus imágenes etiquetadas.
  • Evaluación y despliegue: Prueba tu modelo entrenado con nuevas imágenes, evalúa su precisión y despliégalo en aplicaciones prácticas como la fabricación, la vigilancia aérea o el análisis de documentos.

Link to this sectionAplicaciones habilitadas por la detección OBB#

Los objetos que están descentrados o inclinados son bastante comunes en escenarios de la vida real. Repasemos algunos ejemplos donde la detección OBB marca una diferencia real al detectar con precisión estos objetos.

Link to this sectionAnálisis de imágenes de rayos X mediante detección OBB#

La detección OBB puede llevar el análisis de imágenes médicas un paso más allá al mejorar la precisión. Las imágenes médicas a menudo incluyen estructuras anatómicas como tumores, órganos o huesos. Estas estructuras a menudo aparecen con formas irregulares y orientaciones variadas. Dado que los OBB pueden rotar para ajustarse al ángulo de un objeto, proporcionan una localización y medición más precisas, lo cual es fundamental para el diagnóstico y la planificación del tratamiento.

Este enfoque es especialmente efectivo cuando se trata de analizar imágenes de rayos X de fracturas óseas, donde la posición y alineación de los huesos son factores clave. Por ejemplo, la detección OBB se ha utilizado para analizar rayos X de codo pediátrico. Al ajustarse a la orientación de los huesos, ayudó a mejorar la precisión de la detección.

Radiografías con detección de objetos y detección de cajas delimitadoras orientadas

Fig 3. Rayos X (a, d) con detección de objetos (b, e) y detección mediante cuadros delimitadores orientados (c, f).

Link to this sectionVigilancia aérea potenciada por la detección OBB#

La vigilancia aérea es una herramienta esencial en sectores como la seguridad pública, el seguimiento medioambiental y la planificación urbana. Las imágenes capturadas por drones o satélites pueden ayudar a identificar objetos como barcos, vehículos y edificios. Sin embargo, en estas imágenes, los objetos suelen parecer pequeños y estar en ángulos inusuales, lo que los hace más difíciles de detectar con precisión.

La detección OBB resuelve esto inclinando los cuadros delimitadores para que coincidan con el ángulo de cada objeto. Esto conduce a mediciones más precisas del tamaño y la orientación de un objeto, lo que respalda una mejor toma de decisiones en áreas como la planificación urbana, la defensa, la respuesta ante desastres y el seguimiento medioambiental.

Un ejemplo interesante de detección OBB es el seguimiento de barcos en vigilancia marítima. Las imágenes de satélite a menudo capturan barcos en ángulos y tamaños variables debido al clima, la iluminación o el movimiento. Los OBB pueden adaptarse a estos cambios, mejorando la detección, especialmente para embarcaciones más pequeñas o parcialmente obstruidas.

Uso de la detección OBB para vigilancia marítima

Fig 4. Un vistazo al uso de la detección OBB para la vigilancia marítima.

Link to this sectionUso de la detección OBB en la agricultura#

Clasificar los cultivos después de la cosecha es un paso crucial para garantizar la calidad antes de que se empaqueten y envíen al mercado. Si bien muchos sistemas funcionan bien para frutas redondas como manzanas y naranjas, los cultivos largos y estrechos, como las zanahorias o los brotes de Zizania, pueden ser mucho más difíciles de manejar. Sus formas varían y, a menudo, terminan en diferentes ángulos, lo que los hace complicados de detectar y clasificar con precisión.

Para abordar esto, los investigadores han desarrollado un sistema que utiliza la detección mediante cuadros delimitadores orientados (OBB) para identificar y clasificar estos cultivos con mayor precisión. El sistema puede detectar múltiples cultivos en una imagen, incluso si están inclinados o superpuestos, y evaluar su calidad y posición en tiempo real.

Link to this sectionPros y contras de la detección OBB#

Aquí tienes algunos de los beneficios de usar la detección OBB:

  • Mejora de la entrada para tareas posteriores: Las tareas de visión artificial como la segmentación de instancias y el seguimiento de objetos pueden funcionar mejor cuando reciben detecciones de objetos más precisas.
  • Razonamiento espacial mejorado: Al capturar el ángulo de orientación, los OBB hacen posible comprender la alineación y dirección de un objeto.
  • Reducción de la superposición en escenas concurridas: Los OBB reducen la ambigüedad al ajustar los objetos más ceñidamente, incluso en escenas ocupadas o desordenadas.

A pesar de ayudar a mejorar la precisión de la detección en escenas complejas, la detección OBB conlleva algunas limitaciones a tener en cuenta:

  • Mayor sensibilidad al ruido: Pequeños errores en la predicción del ángulo pueden tener un mayor impacto en la precisión de la detección, especialmente para objetos muy juntos o alargados.
  • Necesidad de herramientas especializadas: Dado que no todas las plataformas de etiquetado y entrenamiento admiten OBB de forma nativa, trabajar con ellos puede requerir herramientas o configuraciones adicionales.
  • Disponibilidad limitada de conjuntos de datos: En comparación con la detección de objetos estándar, actualmente hay menos conjuntos de datos disponibles públicamente con anotaciones OBB, lo que puede hacer un poco más difícil empezar o comparar resultados.

Link to this sectionConclusiones clave#

La detección mediante cuadros delimitadores orientados hace que sea más fácil para las soluciones de visión artificial reconocer objetos que no están perfectamente rectos o alineados. Al capturar tanto la posición como la orientación de los objetos, la detección OBB aumenta la precisión en casos de uso del mundo real, como el escaneado de imágenes médicas, la monitorización de tierras de cultivo o el análisis de fotos de satélite.

Con modelos como YOLO11 que hacen que la detección OBB sea más accesible, se está convirtiendo en una opción práctica para muchas industrias. Tanto si tratas con objetos inclinados, superpuestos o de formas extrañas, la detección OBB añade una capa extra de precisión que los métodos estándar a menudo pasan por alto.

¿Sientes curiosidad por la IA? Explora nuestro GitHub repository, conecta con our community y consulta our licensing options para poner en marcha tu proyecto de computer vision. Aprende más sobre innovaciones como AI in retail y computer vision in the logistics en nuestras páginas de soluciones.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático