Yolo Vision Shenzhen
Shenzhen
Únete ahora

Despliegue de Ultralytics YOLO11 en Rockchip para una inteligencia artificial de vanguardia eficiente

Abirami Vina

5 minutos de lectura

12 de febrero de 2025

Explore cómo desplegar Ultralytics YOLO11 en Rockchip utilizando el kit de herramientas RKNN para una IA Edge eficiente, aceleración de IA y detección de objetos en tiempo real.

Una palabra de moda reciente en la comunidad de la IA es la IA en el borde (edge AI), especialmente cuando se trata de visión artificial. A medida que crecen las aplicaciones impulsadas por la IA, existe una mayor necesidad de ejecutar modelos de manera eficiente en dispositivos integrados con recursos informáticos y de energía limitados. 

Por ejemplo, los drones utilizan Vision AI para la navegación en tiempo real, las cámaras inteligentes detect objetos al instante y los sistemas de automatización industrial realizan controles de calidad sin depender de la computación en la nube. Estas aplicaciones requieren un procesamiento rápido y eficiente de la IA directamente en los dispositivos periféricos para garantizar un rendimiento en tiempo real y una baja latencia. Sin embargo, ejecutar modelos de IA en dispositivos periféricos no siempre es fácil. Los modelos de IA suelen requerir más potencia y memoria de la que muchos dispositivos periféricos pueden manejar.

El kit de herramientas RKNN de Rockchip ayuda a resolver este problema optimizando los modelos de aprendizaje profundo para dispositivos alimentados por Rockchip. Utiliza unidades de procesamiento neuronal (NPU) dedicadas para acelerar la inferencia, reduciendo la latencia y el consumo de energía en comparación con el procesamiento en CPU o GPU . 

La comunidad de Vision AI ha estado ansiosa por ejecutar Ultralytics YOLO11 en dispositivos basados en Rockchip, y os hemos escuchado. Hemos añadido soporte para exportar YOLO11 al formato de modelo RKNN. En este artículo, exploraremos cómo funciona la exportación a RKNN y por qué la implementación de YOLO11 en dispositivos con Rockchip cambia las reglas del juego.

¿Qué es Rockchip y el RKNN Toolkit?

Rockchip es una empresa que diseña sistemas en chip (SoC), procesadores diminutos pero potentes que hacen funcionar muchos dispositivos integrados. Estos chips combinan una CPU, una GPU y una unidad de procesamiento neuronal (NPU) para gestionar desde tareas informáticas generales hasta aplicaciones de IA de visión basadas en la detección de objetos y el procesamiento de imágenes.

Los SoC de Rockchip se utilizan en una variedad de dispositivos, incluyendo ordenadores de placa única (SBC), placas de desarrollo, sistemas de IA industrial y cámaras inteligentes. Muchos fabricantes de hardware conocidos, Radxa, ASUS, Pine64, Orange Pi, Odroid, Khadas y Banana Pi, construyen dispositivos alimentados por SoC de Rockchip. Estas placas son populares para aplicaciones de IA en el borde y visión artificial porque ofrecen un equilibrio de rendimiento, eficiencia energética y asequibilidad.

__wf_reserved_inherit
Fig. 1. Un ejemplo de un dispositivo alimentado por Rockchip.

Para ayudar a que los modelos de IA se ejecuten de manera eficiente en estos dispositivos, Rockchip proporciona el RKNN (Rockchip Neural Network) Toolkit. Permite a los desarrolladores convertir y optimizar modelos de aprendizaje profundo para utilizar las Unidades de Procesamiento Neuronal (NPU) de Rockchip. 

Los modelos RKNN están optimizados para la inferencia de baja latencia y el uso eficiente de energía. Al convertir los modelos a RKNN, los desarrolladores pueden lograr velocidades de procesamiento más rápidas, un menor consumo de energía y una mayor eficiencia en los dispositivos con tecnología Rockchip.

Los modelos RKNN están optimizados

Analicemos más de cerca cómo los modelos RKNN mejoran el rendimiento de la IA en dispositivos habilitados para Rockchip. 

A diferencia de las CPU y las GPU, que gestionan una amplia gama de tareas informáticas, las NPU de Rockchip están diseñadas específicamente para el aprendizaje profundo. Al convertir los modelos de IA al formato RKNN, los desarrolladores pueden ejecutar inferencias directamente en la NPU. Esto hace que los modelos RKNN sean especialmente útiles para tareas de visión artificial en tiempo real, donde el procesamiento rápido y eficiente es esencial.

Las NPU son más rápidas y eficientes que las CPU y las GPU para las tareas de IA porque están construidas para manejar los cálculos de redes neuronales en paralelo. Mientras que las CPU procesan las tareas paso a paso y las GPU distribuyen las cargas de trabajo entre múltiples núcleos, las NPU están optimizadas para realizar cálculos específicos de la IA de forma más eficiente. 

Como resultado, los modelos RKNN se ejecutan más rápido y utilizan menos energía, lo que los hace ideales para dispositivos alimentados por baterías, cámaras inteligentes, automatización industrial y otras aplicaciones de Edge AI que requieren toma de decisiones en tiempo real.

Visión general de los modelosYOLO Ultralytics

Los modelosYOLO (You Only Look Once)Ultralytics están diseñados para tareas de visión por ordenador en tiempo real, como la detección de objetos, la segmentación de instancias y la clasificación de imágenes. Son conocidos por su velocidad, precisión y eficacia, y se utilizan ampliamente en sectores como la agricultura, la fabricación, la sanidad y los sistemas autónomos. 

Estos modelos han mejorado sustancialmente con el tiempo. Por ejemplo, Ultralytics YOLOv5 facilitó la detección de objetos con PyTorch. Después, Ultralytics YOLOv8 añadió nuevas funciones como la estimación de la pose y la clasificación de imágenes. Ahora, YOLO11 va más allá y aumenta la precisión utilizando menos recursos. De hecho, YOLO11m obtiene mejores resultados en el conjunto de datos COCO utilizando un 22% menos de parámetros que YOLOv8m, lo que lo hace más preciso y eficiente.

__wf_reserved_inherit
Fig. 2. Detección de objetos con YOLO11.

Los modelosYOLO Ultralytics también admiten la exportación a varios formatos, lo que permite un despliegue flexible en diferentes plataformas. Estos formatos incluyen ONNX, TensorRT, CoreML y OpenVINO, lo que ofrece a los desarrolladores la libertad de optimizar el rendimiento en función del hardware de destino.

Con el soporte añadido para exportar YOLO11 al formato de modelo RKNN, YOLO11 puede aprovechar ahora las NPU de Rockchip. El modelo más pequeño, YOLO11n en formato RKNN, alcanza un impresionante tiempo de inferencia de 99,5 ms por imagen, lo que permite el procesamiento en tiempo real incluso en dispositivos integrados.

Exportación del modelo YOLO11 al formato RKNN

Actualmente, los modelos de detección de objetos YOLO11 pueden exportarse al formato RKNN. Además, permanece atento - estamos trabajando para añadir soporte para las otras tareas de visión por computador y la cuantización INT8 en futuras actualizaciones. 

Exportar YOLO11 al formato RKNN es un proceso sencillo. Puede cargar su modelo YOLO11 personalizado, especificar la plataforma Rockchip de destino y convertirlo al formato RKNN con unas pocas líneas de código. El formato RKNN es compatible con varios SoC de Rockchip, incluidos RK3588, RK3566 y RK3576, lo que garantiza una amplia compatibilidad de hardware.

__wf_reserved_inherit
Fig. 3. Exportación de YOLO11 al formato de modelo RKNN.

Implantación de YOLO11 en dispositivos basados en Rockchip

Una vez exportado, el modelo RKNN puede desplegarse en dispositivos basados en Rockchip. Para desplegar el modelo, basta con cargar el archivo RKNN exportado en el dispositivo Rockchip y ejecutar la inferencia, es decir, el proceso de utilizar el modelo de IA entrenado para analizar nuevas imágenes o vídeos y detect objetos en tiempo real. Con unas pocas líneas de código, puede empezar a identificar objetos a partir de imágenes o secuencias de vídeo.

__wf_reserved_inherit
Fig. 4. Ejecución de una inferencia utilizando el modelo RKNN exportado.

Aplicaciones Edge AI de YOLO11 y Rockchip

Para hacernos una mejor idea de dónde puede desplegarse YOLO11 en dispositivos Rockchip en el mundo real, veamos algunas aplicaciones clave de inteligencia artificial.

Los procesadores Rockchip se utilizan ampliamente en tabletas Android, placas de desarrollo y sistemas industriales de IA. Gracias a la compatibilidad con Android, Linux y Python, puede crear e implantar fácilmente soluciones Vision basadas en IA para diversos sectores.

Tabletas resistentes integradas con YOLO11

Una aplicación común que implica ejecutar YOLO11 en dispositivos con Rockchip son las tabletas robustas. Se trata de tabletas duraderas y de alto rendimiento diseñadas para entornos difíciles como almacenes, obras de construcción y entornos industriales. Estas tabletas pueden aprovechar la detección de objetos para mejorar la eficiencia y la seguridad.

Por ejemplo, en la logística de almacenes, los trabajadores pueden utilizar una tableta Rockchip con YOLO11 para escanear y detect automáticamente el inventario, lo que reduce los errores humanos y acelera los tiempos de procesamiento. Del mismo modo, en las obras de construcción, estas tabletas pueden utilizarse para detect si los trabajadores llevan el equipo de seguridad necesario, como cascos y chalecos, ayudando a las empresas a hacer cumplir la normativa y prevenir accidentes.

__wf_reserved_inherit
Fig. 5. Detección de dispositivos de seguridad con YOLO11.

IA industrial para el control de calidad 

Con respecto a la fabricación y la automatización, las placas industriales con tecnología Rockchip pueden desempeñar un papel importante en el control de calidad y el monitoreo de procesos. Una placa industrial es un módulo de computación compacto y de alto rendimiento diseñado para sistemas integrados en entornos industriales. Estas placas suelen incluir procesadores, memoria, interfaces de E/S y opciones de conectividad que pueden integrarse con sensores, cámaras y maquinaria automatizada.

La ejecución de modelos YOLO11 en estas placas permite analizar las líneas de producción en tiempo real, detectar problemas al instante y mejorar la eficiencia. Por ejemplo, en la fabricación de automóviles, un sistema de IA que utilice hardware Rockchip y YOLO11 puede detect arañazos, piezas desalineadas o defectos de pintura a medida que los coches avanzan por la cadena de montaje. Al identificar estos defectos en tiempo real, los fabricantes pueden reducir los residuos, disminuir los costes de producción y garantizar unos niveles de calidad más altos antes de que los vehículos lleguen a los clientes.

Ventajas de ejecutar YOLO11 en dispositivos basados en Rockchip

Los dispositivos basados en Rockchip ofrecen un buen equilibrio entre rendimiento, coste y eficiencia, lo que los convierte en una excelente opción para implantar YOLO11 en aplicaciones de inteligencia artificial periférica.

He aquí algunas ventajas de ejecutar YOLO11 en dispositivos basados en Rockchip:

  • Mejora Rendimiento de la IA: Los dispositivos habilitados para Rockchip gestionan la inferencia de IA de forma más eficiente que las placas CPU como Raspberry Pi, ofreciendo una detección de objetos más rápida y una latencia menor.
  • Solución rentable: Si estás experimentando con IA y necesitas una opción económica pero que ofrezca un rendimiento potente, Rockchip es una gran opción. Proporciona una forma asequible de ejecutar YOLO11 sin comprometer la velocidad ni la eficiencia.
  • Eficiencia energética: La ejecución de modelos de visión artificial en dispositivos con tecnología Rockchip consume menos energía que las GPU, lo que la hace ideal para dispositivos que funcionan con baterías y aplicaciones de IA integradas.

Conclusiones clave

Ultralytics YOLO11 puede ejecutarse eficazmente en dispositivos basados en Rockchip aprovechando la aceleración por hardware y el formato RKNN. Esto reduce el tiempo de inferencia y mejora el rendimiento, por lo que resulta ideal para tareas de visión por ordenador en tiempo real y aplicaciones de IA de vanguardia.

El kit de herramientas RKNN ofrece herramientas de optimización clave, como la cuantización y el ajuste fino, que garantizan el buen rendimiento de los modelos YOLO11 en las plataformas Rockchip. Optimizar los modelos para un procesamiento eficiente en el dispositivo será esencial a medida que aumente la adopción de la IA en los bordes. Con las herramientas y el hardware adecuados, los desarrolladores pueden abrir nuevas posibilidades para las soluciones de visión artificial en diversos sectores. 

Únase a nuestra comunidad y explore nuestro repositorio de GitHub para obtener más información sobre la IA. Vea cómo la visión artificial en la agricultura y la IA en la sanidad están impulsando la innovación visitando nuestras páginas de soluciones. Además, consulte nuestras opciones de licencia para empezar a crear sus soluciones de IA de visión hoy mismo.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis