Ejecución de modelos Ultralytics YOLO en el AI PC de Intel con OpenVINO
Vuelve a ver la charla de Dmitriy Pastushenkov y Adrian Boguszewski en YOLO Vision 2024 sobre la optimización de modelos YOLO con Intel OpenVINO y la ejecución de inferencias en tiempo real en los AI PC de Intel.

YOLO Vision 2024 (YV24), el evento híbrido anual de Ultralytics, reunió a entusiastas de la IA, desarrolladores y expertos de todo el mundo para explorar las últimas innovaciones en visión artificial. YV24 fue una gran oportunidad y plataforma para debatir sobre nuevos avances. El evento contó con actores clave del sector de la IA que presentaron sus últimas innovaciones. Entre ellos estaba Intel, que participó en el evento presentando una ponencia sobre su nuevo y revolucionario PC con IA y la integración de Intel OpenVINO con modelos Ultralytics YOLO como Ultralytics YOLO11.
La charla fue dirigida por Adrian Boguszewski, un evangelista de software que coescribió el conjunto de datos LandCover.ai y forma a los desarrolladores sobre el kit de herramientas OpenVINO de Intel, y Dmitriy Pastushenkov, un evangelista de PC con IA con más de 20 años de experiencia en automatización industrial e IA. Durante el evento, Adrian compartió su entusiasmo y dijo: "Este es un gran evento hoy, no solo porque Ultralytics ha lanzado una nueva versión de YOLO, sino también porque podemos presentar este nuevo modelo funcionando en nuestro nuevo hardware, así como una nueva versión de OpenVINO".
En este artículo, echaremos un vistazo a los aspectos más destacados de la charla de Intel en YV24, profundizando en los pormenores de su PC con IA, la serie Intel Core Ultra 200V, y cómo se integran con los modelos Ultralytics YOLO mediante el kit de herramientas OpenVINO. ¡Empecemos!
Link to this sectionTecnologías de IA de vanguardia en 2024#
Dmitriy comenzó la ponencia profundizando en las diferencias clave entre la IA tradicional y la IA generativa. El enfoque giró en torno a cómo estas tecnologías y sus casos de uso están evolucionando en 2024. Las técnicas de IA tradicional como la visión artificial y el procesamiento del lenguaje natural han sido esenciales para tareas como la estimación de poses, la detección de objetos y el reconocimiento de voz. La IA generativa, sin embargo, representa una nueva ola de tecnología de IA que implica aplicaciones como chatbots, generación de texto a imagen, escritura de código e incluso texto a vídeo.

Fig 1. Adrian y Dmitriy de Intel, en el escenario de YV24, discutiendo casos de uso de IA.
Dmitriy señaló la diferencia de escala entre ambas. Explicó que, mientras que los modelos de IA tradicionales constan de millones de parámetros, los modelos de IA generativa operan a una escala mucho mayor. Los modelos de IA generativa suelen implicar miles de millones o incluso billones de parámetros, lo que los hace mucho más exigentes desde el punto de vista computacional.
Link to this sectionEl PC con IA de Intel: una nueva frontera del hardware de IA#
Dmitriy presentó el PC con IA de Intel como una nueva solución de hardware diseñada para abordar los crecientes desafíos de ejecutar modelos de IA tradicionales y generativos de manera eficiente. El PC con IA de Intel es una máquina potente y energéticamente eficiente. Es capaz de ejecutar una amplia gama de modelos de IA localmente, sin necesidad de procesamiento en la nube.
El procesamiento local ayuda a mantener la privacidad de los datos. Cuando los modelos de IA pueden operar de forma independiente a las conexiones a Internet, se resuelven las inquietudes éticas de las industrias respecto a la privacidad y la seguridad.
La fuerza motriz detrás del PC con IA de Intel es el procesador Intel Core Ultra 200V Series. Este procesador incorpora tres componentes clave: la unidad central de procesamiento (CPU), la unidad de procesamiento gráfico (GPU) y la unidad de procesamiento neuronal (NPU). Cada una desempeña un papel específico en el manejo de diferentes tipos de cargas de trabajo de IA. La CPU es ideal para tareas más pequeñas y de baja latencia que requieren respuestas rápidas, mientras que la GPU está optimizada para operaciones de alto rendimiento como la ejecución de modelos de IA. La NPU, diseñada para la eficiencia energética, es muy adecuada para tareas de larga duración como la detección de objetos en tiempo real con modelos como YOLO11.
Se destacó que la CPU puede ofrecer hasta 5 TOPS (billones de operaciones por segundo), la GPU hasta 67 TOPS, y la NPU proporciona una forma energéticamente eficiente de ejecutar tareas de IA continuamente sin agotar los recursos del sistema.
Link to this sectionAvances de IA de Intel: serie Intel Core Ultra 200V#
El procesador Intel Core Ultra 200V Series integra los tres motores de IA (NPU, CPU y GPU) en un único chip pequeño. Su diseño es perfectamente adecuado para dispositivos compactos como portátiles, sin sacrificar el rendimiento.
El procesador también incluye memoria RAM integrada, lo que reduce la necesidad de tarjetas gráficas independientes. Esto ayuda a disminuir el consumo de energía y mantiene el dispositivo compacto. Dmitriy también hizo hincapié en la flexibilidad del procesador. Los usuarios pueden decidir si ejecutar modelos de IA en la CPU, la GPU o la NPU, según la tarea. Por ejemplo, la detección de objetos con modelos YOLO11 puede ejecutarse en cualquiera de estos motores, mientras que tareas más complejas, como la generación de texto a imagen, pueden utilizar tanto la GPU como la NPU al mismo tiempo para obtener un mejor rendimiento.
Durante la presentación, Dmitriy sacó el chip de su bolsillo, dando a todos una idea clara de lo pequeño que es realmente, a pesar de su capacidad para manejar tareas de IA tan avanzadas. Fue una forma divertida y memorable de mostrar cómo Intel está llevando potentes capacidades de IA a dispositivos más portátiles y prácticos.

Fig 2. El procesador Intel Core Ultra 200V puede caber en un bolsillo.
Link to this sectionOptimización de modelos de IA con Intel OpenVINO#
Tras haber mostrado los últimos avances en hardware de Intel, Dmitriy cambió de tema para hablar de la pila de software de Intel que admite la IA. Presentó OpenVINO, el marco de trabajo de código abierto de Intel diseñado para optimizar y desplegar modelos de IA de forma eficiente en diferentes dispositivos. OpenVINO va más allá de las tareas visuales, extendiendo su soporte a modelos de IA utilizados para el procesamiento del lenguaje natural, procesamiento de audio, transformers, etc.
OpenVINO es compatible con plataformas populares como PyTorch, TensorFlow y ONNX, y los desarrolladores pueden incorporarlo fácilmente a sus flujos de trabajo. Una característica clave a la que prestó atención fue la cuantización. La cuantización comprime los pesos del modelo para reducir su tamaño, de modo que los modelos grandes puedan ejecutarse sin problemas en dispositivos locales sin necesidad de la nube. OpenVINO funciona en múltiples marcos de trabajo, ejecutándose en CPU, GPU, NPU, FPGA o incluso dispositivos ARM, y es compatible con Windows, Linux y macOS. Dmitriy también guio a la audiencia a través de lo fácil que es empezar con OpenVINO.

Fig 3. Dmitriy explicando cómo empezar con OpenVINO.
Link to this sectionIntegración de Ultralytics con Intel OpenVINO#
En la segunda parte de la charla, el micrófono pasó a Adrian, quien explicó la integración perfecta entre los modelos Ultralytics YOLO y el kit de herramientas OpenVINO de Intel, simplificando el proceso de despliegue de modelos YOLO. Proporcionó una explicación paso a paso de cómo exportar un modelo YOLO mediante el paquete Python de Ultralytics al formato OpenVINO es rápido y directo. Esta integración facilita enormemente a los desarrolladores la optimización de sus modelos para el hardware de Intel y el aprovechamiento máximo de ambas plataformas.

Fig 4. Adrian explicando cómo Ultralytics facilita la exportación de tu modelo al formato OpenVINO.
Adrian demostró que una vez que un modelo Ultralytics YOLO está entrenado, puedes exportarlo usando unas sencillas flags de línea de comandos. Por ejemplo, puedes especificar si deseas exportar el modelo como una versión de punto flotante para obtener la máxima precisión o como una versión cuantizada para mejorar la velocidad y la eficiencia. También destacó cómo los desarrolladores pueden gestionar este proceso directamente a través de código, utilizando opciones como la cuantización INT8 para mejorar el rendimiento sin sacrificar demasiada precisión.
Link to this sectionDemos de IA en tiempo real en el PC con IA de Intel#
Poniendo toda esta teoría en práctica, el equipo de Intel presentó una demostración en tiempo real de detección de objetos ejecutando YOLO11 en el PC con IA de Intel. Adrian mostró cómo el sistema manejaba el modelo a través de diferentes procesadores, logrando 36 fotogramas por segundo (FPS) en la CPU con un modelo de coma flotante, más de 100 FPS en la GPU integrada y 70 FPS con la versión cuantizada INT8. Pudieron mostrar lo eficientemente que el PC con IA de Intel puede gestionar tareas complejas de IA.
También señaló que el sistema puede ejecutar modelos en paralelo, utilizando la CPU, la GPU y la NPU juntas para tareas donde todos los datos o fotogramas de vídeo están disponibles de antemano. Esto es útil al procesar cargas pesadas como vídeos. El sistema puede dividir la carga de trabajo entre diferentes procesadores, haciéndolo más rápido y eficiente.
Para terminar, Adrian mencionó que los usuarios podían probar demos en casa, incluyendo soluciones como el conteo de personas y la gestión inteligente de colas. Luego mostró una demo extra donde los usuarios podían introducir prompts para generar imágenes de ensueño en tiempo real en la GPU. Demostró la versatilidad del PC con IA de Intel tanto para tareas de IA tradicionales como para proyectos creativos de IA generativa.
Link to this sectionDetección de objetos en tiempo real con Intel OpenVINO#
En el evento, Intel tenía un stand donde mostraban una demo de detección de objetos en tiempo real utilizando YOLO11, ejecutándose en su PC con IA de Intel. Los asistentes pudieron ver el modelo en acción, optimizado con OpenVINO y desplegado en el procesador Intel Core Ultra 200V.

Fig 5. Los asistentes tuvieron la oportunidad de ver una demo en tiempo real en el stand de Intel OpenVINO.
En el stand de Intel, Dmitriy compartió: "Esta es mi primera vez en YOLO Vision y estoy feliz de estar en Madrid. Estamos presentando el modelo YOLO11 de Ultralytics, ejecutándose en el procesador Intel Core Ultra 200V. Muestra un rendimiento excelente y utilizamos OpenVINO para optimizar y desplegar el modelo. Fue muy fácil colaborar con Ultralytics y ejecutar el modelo en el último hardware de Intel, utilizando la CPU, la GPU y la NPU". El stand también tenía algunos regalos divertidos, como camisetas y cuadernos para que los asistentes se los llevaran a casa.
Link to this sectionConclusiones clave#
La charla técnica de Intel en YV24, centrada en los procesadores Intel Core Ultra 200V Series, mostró cómo el kit de herramientas OpenVINO optimiza modelos de IA como Ultralytics YOLO11. Esta integración permite a los usuarios ejecutar modelos YOLO directamente en sus dispositivos, ofreciendo un gran rendimiento para tareas de visión artificial como la detección de objetos. El beneficio clave es que los usuarios no necesitan depender de servicios en la nube.
Los desarrolladores y entusiastas de la IA pueden ejecutar y ajustar fácilmente los modelos YOLO, utilizando plenamente hardware como CPUs, GPUs y NPUs para aplicaciones en tiempo real. El kit de herramientas Intel OpenVINO, en combinación con los modelos Ultralytics YOLO, abre nuevas posibilidades para llevar capacidades avanzadas de IA directamente a dispositivos personales, convirtiéndolo en una opción ideal para desarrolladores deseosos de impulsar innovaciones de IA en diversas industrias.
¡Colaboremos e innovemos! Visita nuestro repositorio de GitHub para explorar nuestras contribuciones y participar con nuestra comunidad. Mira cómo estamos utilizando la IA para generar un impacto en industrias como la fabricación y la sanidad.






