Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Configuración de cookies
Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Comprenda cómo Ultralytics YOLO11 puede mejorar la detección de objetos utilizando bounding boxes orientados (OBB) y para qué aplicaciones es ideal esta tarea de visión artificial.
En este artículo, analizaremos qué es la detección de objetos OBB, dónde se puede aplicar y cómo utilizar YOLO11 para detectar OBB. También explicaremos cómo las nuevas funciones de YOLO11 pueden mejorar estos procesos y cómo ejecutar inferencias y entrenar modelos personalizados para aprovechar al máximo sus capacidades de detección OBB.
Las características de YOLO11 de última generación incluyen tareas como la detección de objetos OBB.
La detección de objetos OBB lleva la detección de objetos tradicional un paso más allá al detectar objetos en diferentes ángulos. A diferencia de los cuadros delimitadores (bounding boxes) regulares que permanecen alineados con los ejes de la imagen, los OBB giran para ajustarse a la orientación del objeto. La detección de objetos OBB se puede utilizar para analizar imágenes aéreas o de satélite donde los objetos no siempre están rectos. En industrias como la planificación urbana, la energía y el transporte, la capacidad de detectar con precisión objetos en ángulo como edificios, vehículos o infraestructura puede formar la base de aplicaciones de visión artificial con beneficios tangibles.
Fig. 1. Comparación de bounding boxes normales y bounding boxes orientados.
YOLO11 admite la detección OBB y se entrenó en el conjunto de datos DOTA v1.0 para detectar objetos como aviones, barcos y tanques de almacenamiento desde diferentes perspectivas. YOLO11 viene en varias variaciones de modelo para adaptarse a diferentes necesidades, incluyendo YOLO11n-obb (Nano), YOLO11s-obb (Small), YOLO11m-obb (Medium), YOLO11l-obb (Large) y YOLO11x-obb (Extra Large). Cada modelo ofrece un tamaño diferente, con distintos niveles de velocidad, precisión y potencia computacional. Los usuarios pueden elegir el modelo que ofrezca el equilibrio adecuado entre velocidad y precisión para su aplicación.
Casos de uso de YOLO11 que introducen un nuevo ángulo a la detección
Las capacidades de detección de objetos de YOLO11, especialmente su soporte para bounding boxes orientados, aportan mayor precisión a diversas industrias. A continuación, veremos algunos ejemplos de cómo YOLO11 y la detección OBB pueden utilizarse en situaciones del mundo real para que los procesos sean más eficientes, precisos y fáciles de gestionar en diferentes campos.
Planificación urbana y supervisión de infraestructuras con YOLO11
La detección de objetos con cuadros delimitadores orientados es particularmente útil aquí porque permite la detección de objetos vistos desde varios ángulos (a menudo el caso de las imágenes aéreas). La precisión es vital aquí para realizar un seguimiento de las zonas industriales, gestionar los impactos ambientales y garantizar que la infraestructura se mantenga adecuadamente. OBB hace que el proceso de detección sea más confiable, lo que ayuda a los planificadores a tomar decisiones informadas sobre el crecimiento, la seguridad y la sostenibilidad de la ciudad. El uso de YOLO11 puede ayudar a los planificadores a monitorear y administrar la infraestructura que mantiene las ciudades funcionando sin problemas.
Fig. 2. Uso de YOLO11 para detectar tanques de almacenamiento en metraje aéreo.
Inspección de paneles solares con drones, YOLO11 e IA en el borde
A medida que la energía renovable y las innovaciones como los parques solares se vuelven más populares, las inspecciones regulares son cada vez más importantes. Los paneles solares deben ser revisados para asegurarse de que están funcionando de manera eficiente. Con el tiempo, cosas como grietas, acumulación de suciedad o desalineación pueden disminuir su rendimiento. Las inspecciones de rutina ayudan a detectar estos problemas a tiempo, para que se pueda realizar el mantenimiento y mantenerlos funcionando sin problemas.
Por ejemplo, los paneles solares pueden ser inspeccionados en busca de daños utilizando drones que están integrados con Edge AI y YOLO11. El análisis de imágenes en el Edge aporta más precisión y eficiencia al proceso de inspección. Debido al movimiento y la perspectiva del dron, las imágenes de vigilancia a menudo pueden capturar paneles solares desde varios ángulos. En estos casos, la detección OBB de YOLO11 puede ayudar a los drones a identificar con precisión los paneles solares.
YOLO11 puede proporcionar información valiosa para la gestión de flotas.
Los puertos gestionan cientos de barcos cada semana, y la gestión de una flota tan grande puede ser un reto. Un elemento adicional de dificultad está involucrado cuando se analizan barcos en imágenes aéreas; los barcos a menudo aparecen en diferentes ángulos. Aquí es donde el soporte de YOLO11 para la detección OBB es útil.
La detección OBB permite que el modelo detecte barcos en varios ángulos con mayor precisión que los cuadros rectangulares estándar. Al usar YOLO11 con OBB, las compañías navieras pueden identificar más fácilmente la ubicación y el estado de su flota, realizando un seguimiento de detalles importantes como los movimientos de la flota y la logística de la cadena de suministro. Estas soluciones habilitadas para la visión ayudan a optimizar las rutas, reducir los retrasos y mejorar la gestión general de la flota en las rutas marítimas.
Fig 3. Uso de YOLO11 para detectar barcos y puertos en ángulo.
YOLO11 para desarrolladores de IA: Detección de bounding boxes orientados
Si es un desarrollador de IA que busca utilizar YOLO11 para la detección OBB, existen dos opciones sencillas para empezar. Si se siente cómodo trabajando con código, el paquete de Python de Ultralytics es una gran elección. Si prefiere una solución sin código, fácil de usar y con capacidades de entrenamiento en la nube, Ultralytics HUB es una plataforma interna diseñada precisamente para eso. Para obtener más detalles, puede consultar nuestra guía sobre cómo entrenar y desplegar Ultralytics YOLO11 utilizando Ultralytics HUB.
Ahora que hemos visto ejemplos de dónde se puede aplicar el soporte OBB de YOLO11, exploremos el paquete de Python de Ultralytics y veamos cómo puedes ejecutar inferencias y entrenar modelos personalizados usándolo.
Ejecución de inferencias usando YOLO11
En primer lugar, para utilizar YOLO11 con Python, tendrá que instalar el paquete Ultralytics. Dependiendo de sus preferencias, puede optar por instalarlo utilizando pip, conda o Docker. Para obtener instrucciones paso a paso, puede consultar nuestra Guía de instalación de Ultralytics. Si tiene algún problema durante la instalación, nuestra Guía de problemas comunes ofrece consejos útiles para la resolución de problemas.
Una vez que haya instalado el paquete Ultralytics, trabajar con YOLO11 es increíblemente sencillo. Ejecutar una inferencia se refiere al proceso de utilizar un modelo entrenado para hacer predicciones sobre nuevas imágenes, como la detección de objetos con OBB en tiempo real. Es diferente del entrenamiento del modelo, que es cuando se le enseña al modelo a reconocer nuevos objetos o a mejorar su rendimiento en tareas específicas. La inferencia se utiliza cuando se desea aplicar el modelo a datos no vistos.
El siguiente ejemplo te guía a través de cómo cargar un modelo y usarlo para predecir oriented bounding boxes en una imagen. Para obtener ejemplos más detallados y consejos de uso avanzado, asegúrate de consultar la documentación oficial de Ultralytics para conocer las mejores prácticas e instrucciones adicionales.
Fig 4. Un fragmento de código que muestra la ejecución de inferencias usando YOLO11.
Entrenamiento de un modelo YOLO11 personalizado
Entrenar un modelo YOLO11 significa que puedes ajustar su rendimiento en conjuntos de datos y tareas específicas, como la detección de objetos con bounding box orientados. Si bien los modelos pre-entrenados como YOLO11 se pueden utilizar para la detección de objetos general, entrenar un modelo personalizado es esencial cuando necesitas que el modelo detecte objetos únicos u optimice el rendimiento en un conjunto de datos específico.
En el fragmento de código siguiente, cubrimos los pasos para entrenar un modelo YOLO11 para la detección de OBB.
En primer lugar, el modelo se inicializa utilizando pesos preentrenados específicos de YOLO11 OBB (yolo11n-obb.pt). A continuación, se utiliza una función de entrenamiento para entrenar el modelo en un conjunto de datos personalizado, con parámetros como el archivo de configuración del conjunto de datos, el número de ciclos de entrenamiento, el tamaño de la imagen de entrenamiento y el hardware en el que se va a ejecutar el entrenamiento (por ejemplo, CPU o GPU). Después del entrenamiento, se valida el rendimiento del modelo para comprobar métricas como la precisión y la pérdida.
Fig. 5. Un ejemplo de entrenamiento de YOLO11 para la detección de objetos OBB.
El camino a seguir para los avances de la IA YOLO11
Ultralytics YOLO11 lleva la detección de objetos al siguiente nivel gracias a su compatibilidad con bounding boxes orientados. Al ser capaz de detectar objetos en diferentes ángulos, YOLO11 puede utilizarse para diversas aplicaciones en diferentes sectores. Por ejemplo, es perfecto para industrias como la planificación urbana, la energía y el transporte marítimo, donde la precisión es crucial para tareas como las inspecciones de paneles solares o la monitorización de flotas. Con un rendimiento más rápido y una precisión mejorada, YOLO11 puede ayudar a los desarrolladores de IA a resolver retos del mundo real.
A medida que la IA se adopta e integra más ampliamente en nuestra vida diaria, modelos como YOLO11 darán forma al futuro de las soluciones de IA.