Explore cómo la detección de cajas delimitadoras orientadas (OBB) mejora la detección de objetos mediante la identificación precisa de objetos rotados en imágenes a través de aplicaciones del mundo real.

Explore cómo la detección de cajas delimitadoras orientadas (OBB) mejora la detección de objetos mediante la identificación precisa de objetos rotados en imágenes a través de aplicaciones del mundo real.
Reconocer objetos, independientemente de cómo estén dispuestos o de hacia dónde miren, es algo natural para nosotros como humanos. Tanto si se trata de coches en un cruce como de barcos en un puerto, podemos decir fácilmente qué son y en qué dirección apuntan. Sin embargo, para los sistemas de inteligencia artificial (IA) no es tan sencillo.
Por ejemplo, la visión por ordenador, una rama de la IA centrada en la comprensión de imágenes y vídeos, permite realizar tareas como la detección de objetos, que ayuda a las máquinas a identificar y localizar objetos dentro de una escena. La detección de objetos tradicional se basa en cuadros delimitadores alineados con los ejes para dibujar recuadros alrededor de los objetos. Estos recuadros tienen lados rectos y ángulos rectos fijos. Este método funciona bien cuando los objetos están en posición vertical y no demasiado juntos.
Pero cuando los objetos están inclinados, girados o muy juntos, la detección tradicional de objetos suele tener dificultades para captarlos con precisión. Para hacer frente a estas situaciones más complejas, se han introducido técnicas como la detección de cajas delimitadoras orientadas (OBB ). A diferencia de los cuadros delimitadores estándar, los OBB pueden girar para adaptarse al ángulo y la forma del objeto, lo que permite un ajuste más preciso.
Los modelos de visión artificial como Ultralytics YOLO11, que admiten la detección de OBB, permiten una serie de aplicaciones en tiempo real, especialmente en escenarios en los que la orientación del objeto es importante, como la vigilancia aérea. Además, la detección de OBB también se utiliza en la sanidad, la agricultura y el análisis de documentos.
En este artículo, exploraremos qué es la detección OBB, cómo funciona y dónde se está aplicando en escenarios del mundo real. Empecemos.
Un cuadro delimitador orientado es un tipo de cuadro rectangular utilizado en visión por ordenador para representar objetos detectados en una imagen. Mientras que los cuadros delimitadores estándar se alinean con los ejes horizontal y vertical de la imagen, los OBB pueden girar para adaptarse al ángulo real del objeto.
Esta capacidad de rotación aporta varias ventajas. Los OBB pueden alinearse más estrechamente con la orientación de un objeto, lo que permite que la caja se ajuste a la forma y dirección del objeto. Como resultado, la detección es más exacta y precisa.
Los OBB son especialmente útiles cuando los objetos no están perfectamente erguidos, como un coche que gira en una carretera curva en imágenes aéreas, un libro inclinado sobre un escritorio o un tumor girado en una exploración médica. Al adaptarse con mayor precisión al ángulo de un objeto, los OBB mejoran el rendimiento de la detección, reducen las interferencias de fondo y son especialmente útiles en aplicaciones en las que la orientación de un objeto es tan importante como su posición.
La detección OBB y la detección de objetos tradicional pueden parecer similares a primera vista, pero se utilizan de diferentes maneras y para diferentes situaciones. Veamos cómo se comparan con un ejemplo.
Los modelos de visión artificial, como YOLO11, pueden entrenarse para detectar y clasificar objetos en diversas aplicaciones del mundo real, como la inspección industrial. Pensemos en una cadena de montaje de una fábrica en la que diferentes piezas de una máquina se desplazan por una cinta transportadora. Algunas piezas pueden estar perfectamente colocadas, pero otras pueden estar ligeramente giradas, inclinadas o superpuestas debido a la vibración o la velocidad.
La detección de objetos tradicional utiliza recuadros rectangulares verticales que se alinean con los bordes horizontales y verticales de la imagen. Por eso, cuando se gira una pieza, es posible que el recuadro no se ajuste correctamente: podría dejar fuera parte del objeto o incluir demasiado del fondo. Esto puede hacer que las detecciones sean menos precisas y que al sistema le resulte más difícil identificar la pieza con seguridad.
Supongamos que utiliza la detección OBB. En este caso, el modelo puede dibujar una caja que gire para coincidir con el ángulo exacto de cada pieza. Un engranaje inclinado o un componente en ángulo quedarán estrechamente encerrados por una caja que se ajuste a su forma y dirección. Esto se traduce en una mayor precisión, menos errores y resultados más fiables, sobre todo en casos de uso como el control de calidad automatizado o la clasificación robótica.
Ahora que entendemos mejor qué es la detección de OBB, echemos un vistazo a algunos de los modelos de Vision AI más utilizados que la soportan.
Se han desarrollado varios modelos avanzados de visión por ordenador específicamente para detectar objetos girados o inclinados. Entre ellos, los modelos Ultralytics YOLO son especialmente conocidos por su capacidad de detección fiable y eficaz de OBB.
Las versiones anteriores, como Ultralytics YOLOv5, se diseñaron para la detección de objetos estándar. Las iteraciones posteriores, como Ultralytics YOLOv8 y la más reciente YOLO11, introdujeron soporte nativo para la detección de OBB. YOLO11, en particular, ofrece una precisión de vanguardia sin comprometer la velocidad, lo que lo convierte en una opción impactante para aplicaciones en tiempo real.
Los modelos OBB preentrenados de YOLO11, como YOLO11n-obb, se entrenan en conjuntos de datos como DOTAv1, que consiste en imágenes aéreas anotadas con una serie de clases de objetos como aviones, barcos y pistas de tenis que aparecen en varios ángulos y orientaciones.
Además, estos modelos están disponibles en cinco tamaños diferentes, desde nano (n-obb) hasta extragrande (x-obb), para adaptarse a las distintas necesidades de rendimiento. Esta versatilidad permite su aplicación en diversos sectores, desde la vigilancia de infraestructuras urbanas y la inspección de maquinaria hasta la lectura de texto sesgado en documentos escaneados.
En muchas situaciones del mundo real, los objetos que debe detectar pueden ser totalmente distintos de los que aparecen en los conjuntos de datos de entrenamiento estándar. Por ejemplo, objetos como herramientas en una línea de producción, paquetes de productos o componentes de una placa de circuitos pueden estar girados, colocados de forma irregular o tener una forma diferente.
Para detectar con precisión estos objetos personalizados, especialmente cuando la orientación es importante, es importante entrenar modelos como YOLO11 utilizando sus propias imágenes y etiquetas. Este proceso se conoce como entrenamiento personalizado.
A continuación se describe paso a paso el proceso de entrenamiento de YOLO11 para la detección de OBB:
Los objetos descentrados o inclinados son bastante comunes en la vida real. Veamos algunos ejemplos en los que la detección de OBB marca la diferencia al detectar con precisión estos objetos.
La detección de OBB puede llevar el análisis de imágenes médicas un paso más allá al mejorar la precisión. Las imágenes médicas suelen incluir estructuras anatómicas como tumores, órganos o huesos. Estas estructuras suelen aparecer con formas irregulares y orientaciones variadas. Dado que los OBB pueden girar para adaptarse al ángulo de un objeto, proporcionan una localización y medición más precisas, lo que es fundamental para el diagnóstico y la planificación del tratamiento.
Este enfoque es especialmente eficaz cuando se trata de analizar radiografías de fracturas óseas, en las que la posición y la alineación de los huesos son factores clave. Por ejemplo, la detección OBB se ha utilizado para analizar radiografías pediátricas de codo. Al ajustarse a la orientación de los huesos, ayudó a mejorar la precisión de la detección.
La vigilancia aérea es una herramienta esencial en sectores como la seguridad pública, la vigilancia medioambiental y la planificación urbana. Las imágenes captadas por drones o satélites pueden ayudar a identificar objetos como barcos, vehículos y edificios. Sin embargo, en estas imágenes los objetos suelen aparecer pequeños y en ángulos inusuales, lo que dificulta su detección precisa.
La detección OBB resuelve este problema inclinando los cuadros delimitadores para que coincidan con el ángulo de cada objeto. Así se obtienen mediciones más precisas del tamaño y la orientación de un objeto, lo que permite tomar mejores decisiones en ámbitos como la planificación urbana, la defensa, la respuesta ante catástrofes y la vigilancia del medio ambiente.
Un ejemplo interesante de detección OBB es el seguimiento de buques en la vigilancia marítima. Las imágenes de satélite suelen captar buques en ángulos y tamaños variables debido a las condiciones meteorológicas, la iluminación o el movimiento. Los OBB pueden adaptarse a estos cambios y mejorar la detección, sobre todo de los buques más pequeños o parcialmente ocultos.
Clasificar los cultivos después de la cosecha es un paso crucial para garantizar su calidad antes de envasarlos y enviarlos al mercado. Aunque muchos sistemas funcionan bien con frutas redondas como manzanas y naranjas, los cultivos largos y estrechos, como las zanahorias o los brotes de Zizania, pueden ser mucho más difíciles de manejar. Sus formas varían y a menudo terminan en ángulos diferentes, lo que dificulta su detección y clasificación precisas.
Para solucionar este problema, los investigadores han desarrollado un sistema que utiliza la detección de cajas delimitadoras orientadas (OBB) para identificar y clasificar estos cultivos con mayor precisión. El sistema puede detectar varios cultivos en una imagen, aunque estén inclinados o se solapen, y evaluar su calidad y posición en tiempo real.
Estas son algunas de las ventajas de utilizar la detección OBB:
A pesar de ayudar a mejorar la precisión de la detección en escenas complejas, la detección de OBB presenta algunas limitaciones a tener en cuenta:
La detección de recuadros delimitadores orientados facilita a las soluciones de visión por ordenador el reconocimiento de objetos que no están perfectamente rectos o alineados. Al capturar tanto la posición como la orientación de los objetos, la detección de OBB aumenta la precisión en casos de uso real como el escaneado de imágenes médicas, la supervisión de tierras de cultivo o el análisis de fotos de satélite.
Con modelos como YOLO11, la detección de OBB es cada vez más accesible y se está convirtiendo en una opción práctica para muchos sectores. Tanto si se trata de objetos inclinados, superpuestos o con formas extrañas, la detección de OBB añade una capa adicional de precisión que los métodos estándar suelen pasar por alto.
¿Siente curiosidad por la IA? Explore nuestro repositorio de GitHub, conecte con nuestra comunidad y consulte nuestras opciones de licencia para poner en marcha su proyecto de visión por ordenador. Obtenga más información sobre innovaciones como la IA en el comercio minorista y la visión por ordenador en el sector logístico en nuestras páginas de soluciones.