Yolo Vision Shenzhen
Shenzhen
Únete ahora

Ejecutando modelos Ultralytics YOLO en la AI PC de Intel con OpenVino

Abirami Vina

4 minutos de lectura

9 de octubre de 2024

Revise la charla de Dmitriy Pastushenkov y Adrian Boguszewski en YOLO Vision 2024 sobre la optimización de modelos YOLO con Intel OpenVino y la ejecución de inferencias en tiempo real en la PC con IA de Intel.

YOLO Vision 2024 (YV24), el evento híbrido anual de Ultralytics, reunió a entusiastas de la IA, desarrolladores y expertos de todo el mundo para explorar las últimas innovaciones en visión artificial. YV24 fue una gran oportunidad y plataforma para discutir nuevos avances. El evento contó con la participación de actores clave en la industria de la IA que presentaron sus últimas innovaciones. Entre ellos se encontraba Intel, que participó en el evento presentando una conferencia magistral sobre su nuevo e innovador PC con IA y la integración de Intel OpenVino con modelos Ultralytics YOLO como Ultralytics YOLO11.

La charla fue dirigida por Adrian Boguszewski, un evangelista de software que es coautor del conjunto de datos LandCover.ai y educa a los desarrolladores sobre el kit de herramientas OpenVINO de Intel, y Dmitriy Pastushenkov, un evangelista de PC con IA con más de 20 años de experiencia en automatización industrial e IA. Durante el evento, Adrian compartió su entusiasmo y dijo: "Este es un gran evento hoy, no solo porque Ultralytics entregó una nueva versión de YOLO, sino también porque podemos presentar este nuevo modelo que se ejecuta en nuestro nuevo hardware, así como una nueva versión de OpenVINO".

En este artículo, analizaremos los aspectos más destacados de la charla de Intel en YV24, profundizando en los entresijos de su AI PC, la serie Intel Core Ultra 200V, y cómo se integran con los modelos Ultralytics YOLO utilizando el kit de herramientas OpenVINO. ¡Empecemos!

Tecnologías de IA de vanguardia en 2024

Dmitriy comenzó la conferencia magistral profundizando en las diferencias clave entre la IA tradicional y la IA generativa. El enfoque giró en torno a cómo estas tecnologías y sus casos de uso están evolucionando en 2024. Las técnicas de IA tradicionales como la visión artificial y el procesamiento del lenguaje natural han sido esenciales para tareas como la estimación de la pose, la detección de objetos y el reconocimiento de voz. La IA generativa, sin embargo, representa una nueva ola de tecnología de IA que involucra aplicaciones como chatbots, la generación de texto a imagen, la escritura de código e incluso texto a vídeo

__wf_reserved_inherit
Fig. 1. Adrian y Dmitriy de Intel, en el escenario de YV24, discutiendo casos de uso de la IA.

Dmitriy señaló la diferencia de escala entre los dos. Explicó que, mientras que los modelos de IA tradicionales constan de millones de parámetros, los modelos de IA generativa operan a una escala mucho mayor. Los modelos de IA generativa a menudo involucran miles de millones o incluso billones de parámetros, lo que los hace mucho más exigentes desde el punto de vista computacional.

El PC con IA de Intel: Una nueva frontera de hardware para la IA

Dmitriy presentó el Intel AI PC como una nueva solución de hardware diseñada para abordar los crecientes desafíos de ejecutar modelos de IA tradicionales y generativos de manera eficiente. El Intel AI PC es una máquina potente y de bajo consumo. Es capaz de ejecutar una amplia gama de modelos de IA localmente, sin necesidad de procesamiento basado en la nube. 

El procesamiento local ayuda a mantener la privacidad de los datos sensibles. Cuando los modelos de IA pueden operar independientemente de las conexiones a Internet, se responden las preocupaciones éticas de las industrias con respecto a la privacidad y la seguridad.

El motor que impulsa el Intel AI PC es el procesador Intel Core Ultra Serie 200V. Este procesador incorpora tres componentes clave: la Unidad Central de Procesamiento (CPU), la Unidad de Procesamiento Gráfico (GPU) y la Unidad de Procesamiento Neuronal (NPU). Cada uno desempeña un papel específico en el manejo de diferentes tipos de cargas de trabajo de IA. La CPU es ideal para tareas más pequeñas y de baja latencia que requieren respuestas rápidas, mientras que la GPU está optimizada para operaciones de alto rendimiento, como la ejecución de modelos de IA. La NPU, diseñada para la eficiencia energética, es muy adecuada para tareas de larga duración, como la detección de objetos en tiempo real con modelos como YOLO11

Se destacó que la CPU puede ofrecer hasta 5 TOPS (billones de operaciones por segundo), la GPU hasta 67 TOPS, y la NPU proporciona una forma energéticamente eficiente de ejecutar tareas de IA de forma continua sin agotar los recursos del sistema.

Avances de Intel en IA: Intel Core Ultra serie 200V

El procesador Intel Core Ultra Serie 200V integra los tres motores de IA (NPU, CPU y GPU) en un único chip pequeño. Su diseño es perfecto para dispositivos compactos como portátiles, sin sacrificar el rendimiento.

El procesador también incluye RAM integrada, lo que reduce la necesidad de tarjetas gráficas separadas. Esto ayuda a reducir el consumo de energía y mantiene el dispositivo compacto. Dmitriy también hizo hincapié en la flexibilidad del procesador. Los usuarios pueden decidir si ejecutar los modelos de IA en la CPU, la GPU o la NPU, dependiendo de la tarea. Por ejemplo, la detección de objetos con los modelos YOLO11 puede ejecutarse en cualquiera de estos motores, mientras que las tareas más complejas, como la generación de texto a imagen, pueden utilizar tanto la GPU como la NPU al mismo tiempo para obtener un mejor rendimiento.

Durante la presentación, Dmitriy sacó el chip de su bolsillo, dando a todos una idea clara de lo pequeño que es en realidad, a pesar de su capacidad para manejar tareas de IA tan avanzadas. Fue una forma divertida y memorable de mostrar cómo Intel está llevando potentes capacidades de IA a dispositivos más portátiles y prácticos.

__wf_reserved_inherit
Fig. 2. El procesador Intel Core Ultra 2000V cabe en un bolsillo.

Optimización de modelos de IA con Intel OpenVino

Después de mostrar los últimos avances de hardware de Intel, Dmitriy cambió de tema para hablar del conjunto de software de Intel que soporta la IA. Presentó OpenVINO, el marco de código abierto de Intel diseñado para optimizar e implementar modelos de IA de forma eficiente en diferentes dispositivos. OpenVINO va más allá de las tareas visuales, extendiendo su soporte a modelos de IA utilizados para el procesamiento del lenguaje natural, el procesamiento de audio, los transformadores, etc.

OpenVINO es compatible con plataformas populares como PyTorch, TensorFlow y ONNX, y los desarrolladores pueden incorporarlo fácilmente en sus flujos de trabajo. Una característica clave a la que llamó la atención fue la cuantificación. La cuantificación comprime los pesos del modelo para reducir su tamaño, de modo que los modelos grandes puedan ejecutarse sin problemas en dispositivos locales sin necesidad de la nube. OpenVINO funciona en múltiples frameworks, ejecutándose en CPU, GPU, NPU, FPGA o incluso dispositivos ARM, y es compatible con Windows, Linux y macOS. Dmitriy también guio a la audiencia a través de lo fácil que es comenzar con OpenVINO. 

__wf_reserved_inherit
Fig. 3. Dmitriy explicando cómo empezar a usar OpenVino.

Integración de Ultralytics con Intel OpenVino

En la segunda parte de la charla, el micrófono pasó a Adrian, quien explicó la perfecta integración entre los modelos YOLO de Ultralytics y el kit de herramientas OpenVINO de Intel, simplificando el proceso de implementación de modelos YOLO. Proporcionó una explicación paso a paso de cómo exportar un modelo YOLO utilizando el paquete de Python de Ultralytics al formato OpenVINO es rápido y sencillo. Esta integración facilita enormemente a los desarrolladores la optimización de sus modelos para el hardware de Intel y el máximo aprovechamiento de ambas plataformas.

__wf_reserved_inherit
Fig 4. Adrian explicando cómo Ultralytics facilita la exportación de su modelo al formato OpenVino.

Adrian demostró que una vez que un modelo YOLO de Ultralytics está entrenado, los usuarios pueden exportarlo utilizando unos pocos flags sencillos en la línea de comandos. Por ejemplo, los usuarios pueden especificar si quieren exportar el modelo como una versión de coma flotante para obtener la máxima precisión o como una versión cuantificada para una mejor velocidad y eficiencia. También destacó cómo los desarrolladores pueden gestionar este proceso directamente a través del código, utilizando opciones como la cuantificación INT8 para mejorar el rendimiento sin sacrificar demasiada precisión. 

Demos de IA en tiempo real en el Intel AI PC

Llevando toda esta teoría a la práctica, el equipo de Intel presentó una demostración en tiempo real de la detección de objetos ejecutando YOLO11 en el PC con IA de Intel. Adrian mostró cómo el sistema gestionaba el modelo en diferentes procesadores, alcanzando 36 fotogramas por segundo (FPS) en la CPU con un modelo de coma flotante, más de 100 FPS en la GPU integrada y 70 FPS con la versión cuantificada INT8. Pudieron demostrar lo eficientemente que el PC con IA de Intel puede gestionar tareas complejas de IA.

También señaló que el sistema puede ejecutar modelos en paralelo, utilizando la CPU, la GPU y la NPU juntas para tareas en las que todos los datos o fotogramas de vídeo están disponibles por adelantado. Esto es útil cuando se procesan cargas pesadas como vídeos. El sistema puede dividir la carga de trabajo entre diferentes procesadores, haciéndolo más rápido y eficiente.

Para concluir, Adrian mencionó que los usuarios podían probar demostraciones en casa, incluyendo soluciones como el conteo de personas y la gestión inteligente de colas. Luego mostró una demostración adicional donde los usuarios podían ingresar prompts para generar imágenes oníricas en tiempo real en la GPU. Esto demostró la versatilidad del PC con IA de Intel tanto para tareas de IA tradicionales como para proyectos creativos de IA generativa.

Detección de objetos en tiempo real con Intel OpenVINO

En el evento, Intel tenía un stand donde exhibieron una demostración de detección de objetos en tiempo real utilizando YOLO11, que se ejecutaba en su Intel AI PC. Los asistentes pudieron ver el modelo en acción, optimizado con OpenVINO e implementado en el procesador Intel Core Ultra 200V. 

__wf_reserved_inherit
Fig. 5. Los asistentes tuvieron la oportunidad de ver una demostración en tiempo real en el stand de Intel OpenVino.

En el stand de Intel, Dmitry compartió: "Esta es mi primera vez en YOLO Vision y estoy feliz de estar en Madrid. Estamos presentando el modelo YOLO11 de Ultralytics, que se ejecuta en el procesador Intel Core Ultra 200V. Muestra un rendimiento excelente y utilizamos OpenVINO para optimizar e implementar el modelo. Fue muy fácil colaborar con Ultralytics y ejecutar el modelo en el hardware Intel más reciente, utilizando la CPU, la GPU y la NPU". El stand también tenía algunos obsequios divertidos, como camisetas y cuadernos para que los asistentes se llevaran a casa.

Conclusiones clave

La charla técnica de Intel en YV24, con los procesadores Intel Core Ultra 200V Series, mostró cómo el kit de herramientas OpenVINO optimiza los modelos de IA como Ultralytics YOLO11. Esta integración permite a los usuarios ejecutar modelos YOLO directamente en sus dispositivos, ofreciendo un gran rendimiento para tareas de visión artificial como la detección de objetos. El beneficio clave es que los usuarios no necesitan depender de los servicios en la nube.

Los desarrolladores y entusiastas de la IA pueden ejecutar y ajustar modelos YOLO sin esfuerzo, utilizando plenamente hardware como CPU, GPU y NPU para aplicaciones en tiempo real. El kit de herramientas Intel OpenVINO, en combinación con los modelos YOLO de Ultralytics, abre nuevas posibilidades para llevar capacidades avanzadas de IA directamente a dispositivos personales, lo que lo convierte en una opción ideal para los desarrolladores que desean impulsar las innovaciones de IA en diversas industrias.

¡Colaboremos e innovemos! Visite nuestro repositorio de GitHub para explorar nuestras contribuciones e interactuar con nuestra comunidad. Vea cómo estamos utilizando la IA para generar un impacto en industrias como la fabricación y la atención médica.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis
Enlace copiado al portapapeles