Exécuter les modèles Ultralytics YOLO sur un AI PC Intel avec OpenVINO
Redécouvre la conférence de Dmitriy Pastushenkov et Adrian Boguszewski lors du YOLO Vision 2024 sur l'optimisation des modèles YOLO avec Intel OpenVINO et l'exécution d'inférences en temps réel sur les AI PC d'Intel.

YOLO Vision 2024 (YV24), l'événement hybride annuel d'Ultralytics, a rassemblé des passionnés d'IA, des développeurs et des experts du monde entier pour explorer les dernières innovations en vision par ordinateur. YV24 a été une excellente opportunité et une plateforme pour discuter de nouvelles percées. L'événement a mis en vedette des acteurs clés de l'industrie de l'IA présentant leurs dernières innovations. Parmi eux, Intel, qui a participé à l'événement en présentant une conférence sur son nouveau PC IA révolutionnaire et l'intégration d'Intel OpenVINO avec les modèles Ultralytics YOLO comme Ultralytics YOLO11.
La présentation était animée par Adrian Boguszewski, un évangéliste logiciel co-auteur du jeu de données LandCover.ai qui forme les développeurs sur la boîte à outils OpenVINO d'Intel, et Dmitriy Pastushenkov, un évangéliste PC IA avec plus de 20 ans d'expérience dans l'automatisation industrielle et l'IA. Durant l'événement, Adrian a partagé son enthousiasme en déclarant : « C'est un événement formidable aujourd'hui, non seulement parce qu'Ultralytics a livré une nouvelle version de YOLO, mais aussi parce que nous sommes capables de présenter ce nouveau modèle tournant sur notre nouveau matériel, ainsi qu'une nouvelle version d'OpenVINO. »
Dans cet article, nous examinerons les points forts de la conférence d'Intel au YV24, en explorant les tenants et aboutissants de leur PC IA, la série Intel Core Ultra 200V, et comment ils s'intègrent aux modèles Ultralytics YOLO en utilisant la boîte à outils OpenVINO. Commençons !
Link to this sectionTechnologies d'IA de pointe en 2024#
Dmitriy a commencé la conférence en plongeant dans les différences clés entre l'IA traditionnelle et l'IA générative. L'accent a été mis sur l'évolution de ces technologies et de leurs cas d'usage en 2024. Les techniques d'IA traditionnelle comme la vision par ordinateur et le traitement du langage naturel ont été essentielles pour des tâches comme l'estimation de pose, la détection d'objets et la reconnaissance vocale. L'IA générative, cependant, représente une nouvelle vague de technologie d'IA qui implique des applications telles que les chatbots, la génération texte-image, l'écriture de code et même le texte-vidéo.

Fig 1. Adrian et Dmitriy d'Intel, sur scène au YV24, discutant des cas d'usage de l'IA.
Dmitriy a souligné la différence d'échelle entre les deux. Il a expliqué que tandis que les modèles d'IA traditionnelle consistent en des millions de paramètres, les modèles d'IA générative opèrent à une échelle beaucoup plus vaste. Les modèles d'IA générative impliquent souvent des milliards, voire des trillions de paramètres, les rendant bien plus exigeants en termes de calcul.
Link to this sectionLe PC IA d'Intel : Une nouvelle frontière matérielle pour l'IA#
Dmitriy a présenté le PC IA d'Intel comme une nouvelle solution matérielle conçue pour relever les défis croissants liés à l'exécution efficace des modèles d'IA traditionnelle et générative. Le PC IA d'Intel est une machine puissante et économe en énergie. Il est capable d'exécuter un large éventail de modèles d'IA localement, sans avoir besoin d'un traitement basé sur le cloud.
Le traitement local aide à garder les données privées. Lorsque les modèles d'IA peuvent fonctionner indépendamment des connexions Internet, les préoccupations éthiques des industries concernant la confidentialité et la sécurité sont prises en compte.
La force motrice derrière le PC IA d'Intel est le processeur de la série Intel Core Ultra 200V. Ce processeur intègre trois composants clés : l'unité centrale de traitement (CPU), l'unité de traitement graphique (GPU) et l'unité de traitement neuronal (NPU). Chacun joue un rôle spécifique dans la gestion de différents types de charges de travail IA. Le CPU est idéal pour les petites tâches à faible latence qui nécessitent des réponses rapides, tandis que le GPU est optimisé pour les opérations à haut débit comme l'exécution de modèles d'IA. Le NPU, conçu pour l'efficacité énergétique, est bien adapté aux tâches de longue durée comme la détection d'objets en temps réel avec des modèles comme YOLO11.
Il a été souligné que le CPU peut fournir jusqu'à 5 TOPS (trillions d'opérations par seconde), le GPU jusqu'à 67 TOPS, et le NPU fournit un moyen économe en énergie d'exécuter des tâches d'IA en continu sans épuiser les ressources du système.
Link to this sectionAvancées d'Intel en matière d'IA : Série Intel Core Ultra 200V#
Le processeur de la série Intel Core Ultra 200V intègre les trois moteurs d'IA - NPU, CPU et GPU - dans une seule petite puce. Sa conception est parfaitement adaptée aux appareils compacts comme les ordinateurs portables, sans sacrifier les performances.
Le processeur comprend également une mémoire RAM intégrée, réduisant le besoin de cartes graphiques séparées. Cela aide à réduire la consommation d'énergie et maintient l'appareil compact. Dmitriy a également souligné la flexibilité du processeur. Les utilisateurs peuvent décider s'ils souhaitent exécuter les modèles d'IA sur le CPU, le GPU ou le NPU, en fonction de la tâche. Par exemple, la détection d'objets avec les modèles YOLO11 peut s'exécuter sur n'importe lequel de ces moteurs, tandis que des tâches plus complexes, comme la génération texte-image, peuvent utiliser à la fois le GPU et le NPU simultanément pour de meilleures performances.
Pendant la présentation, Dmitriy a sorti la puce de sa poche, donnant à tout le monde une idée claire de sa petite taille - malgré sa capacité à gérer des tâches d'IA aussi avancées. C'était une manière amusante et mémorable de montrer comment Intel apporte des capacités d'IA puissantes à des appareils plus portables et pratiques.

Fig 2. Le processeur Intel Core Ultra 200V peut tenir dans une poche.
Link to this sectionOptimisation des modèles d'IA avec Intel OpenVINO#
Après avoir présenté les dernières avancées matérielles d'Intel, Dmitriy est passé à la pile logicielle d'Intel qui prend en charge l'IA. Il a présenté OpenVINO, le framework open-source d'Intel conçu pour optimiser et déployer des modèles d'IA efficacement sur différents appareils. OpenVINO va au-delà des tâches visuelles, étendant son support aux modèles d'IA utilisés pour le traitement du langage naturel, le traitement audio, les transformers, etc.
OpenVINO est compatible avec des plateformes populaires comme PyTorch, TensorFlow et ONNX, et les développeurs peuvent facilement l'intégrer dans leurs flux de travail. Une fonctionnalité clé qu'il a mise en avant est la quantification. La quantification compresse les poids du modèle pour réduire leur taille afin que les grands modèles puissent s'exécuter sans accroc sur des appareils locaux sans avoir besoin du cloud. OpenVINO fonctionne sur plusieurs frameworks, tournant sur CPU, GPU, NPU, FPGA ou même des appareils ARM, et prend en charge Windows, Linux et macOS. Dmitriy a également montré à l'audience à quel point il est facile de commencer avec OpenVINO.

Fig 3. Dmitriy expliquant comment commencer avec OpenVINO.
Link to this sectionIntégration d'Ultralytics avec Intel OpenVino#
Dans la deuxième partie de la conférence, le micro a été passé à Adrian, qui a expliqué l'intégration transparente entre les modèles Ultralytics YOLO et la boîte à outils OpenVINO d'Intel, simplifiant le processus de déploiement de modèles YOLO. Il a fourni une explication étape par étape de la façon dont l'exportation d'un modèle YOLO utilisant le package Python d'Ultralytics vers le format OpenVINO est rapide et directe. Cette intégration facilite grandement pour les développeurs l'optimisation de leurs modèles pour le matériel Intel et l'obtention du meilleur rendement des deux plateformes.

Fig 4. Adrian expliquant à quel point Ultralytics facilite l'exportation de ton modèle au format OpenVINO.
Adrian a démontré qu'une fois qu'un modèle Ultralytics YOLO est entraîné, les utilisateurs peuvent l'exporter en utilisant quelques indicateurs simples en ligne de commande. Par exemple, les utilisateurs peuvent spécifier s'ils veulent exporter le modèle en tant que version à virgule flottante pour une précision maximale ou en tant que version quantifiée pour une meilleure vitesse et efficacité. Il a également souligné comment les développeurs peuvent gérer ce processus directement via le code, en utilisant des options comme la quantification INT8 pour améliorer les performances sans sacrifier trop de précision.
Link to this sectionDémos d'IA en temps réel sur le PC IA d'Intel#
Pour mettre toute cette théorie en pratique, l'équipe Intel a présenté une démo en temps réel de détection d'objets en faisant tourner YOLO11 sur le PC IA d'Intel. Adrian a montré comment le système gérait le modèle sur différents processeurs, atteignant 36 images par seconde (FPS) sur le CPU avec un modèle à virgule flottante, plus de 100 FPS sur le GPU intégré, et 70 FPS avec la version quantifiée INT8. Ils ont pu montrer à quel point le PC IA d'Intel peut gérer efficacement des tâches d'IA complexes.
Il a également souligné que le système peut exécuter des modèles en parallèle, en utilisant le CPU, le GPU et le NPU ensemble pour des tâches où toutes les données ou images vidéo sont disponibles au préalable. C'est utile lors du traitement de charges lourdes comme des vidéos. Le système peut répartir la charge de travail entre différents processeurs, la rendant plus rapide et plus efficace.
Pour conclure, Adrian a mentionné que les utilisateurs pouvaient essayer des démos chez eux, y compris des solutions comme le comptage de personnes et la gestion intelligente des files d'attente. Il a ensuite montré une démo bonus où les utilisateurs pouvaient saisir des invites pour générer des images oniriques en temps réel sur le GPU. Cela a démontré la polyvalence du PC IA d'Intel pour les tâches d'IA traditionnelle et les projets d'IA générative créatifs.
Link to this sectionDétection d'objets en temps réel avec Intel OpenVINO#
Lors de l'événement, Intel disposait d'un stand où ils présentaient une démo de détection d'objets en temps réel utilisant YOLO11, tournant sur leur PC IA d'Intel. Les participants ont pu voir le modèle en action, optimisé avec OpenVINO, et déployé sur le processeur Intel Core Ultra 200V.

Fig 5. Les participants ont eu l'occasion de voir une démo en temps réel au stand Intel OpenVINO.
Au stand Intel, Dmitriy a partagé : « C'est ma première fois à YOLO Vision, et je suis heureux d'être à Madrid. Nous présentons le modèle YOLO11 d'Ultralytics, tournant sur le processeur Intel Core Ultra 200V. Il affiche d'excellentes performances, et nous utilisons OpenVINO pour optimiser et déployer le modèle. Il était très facile de collaborer avec Ultralytics et de faire tourner le modèle sur le dernier matériel Intel, en utilisant le CPU, le GPU et le NPU. » Le stand proposait également des cadeaux amusants, tels que des t-shirts et des carnets pour les participants.
Link to this sectionPoints clés#
La conférence technique d'Intel au YV24, mettant en vedette les processeurs de la série Intel Core Ultra 200V, a montré comment la boîte à outils OpenVINO optimise des modèles d'IA comme Ultralytics YOLO11. Cette intégration permet aux utilisateurs d'exécuter des modèles YOLO directement sur leurs appareils, offrant d'excellentes performances pour des tâches de vision par ordinateur comme la détection d'objets. L'avantage clé est que les utilisateurs n'ont pas besoin de dépendre des services cloud.
Les développeurs et les passionnés d'IA peuvent exécuter et ajuster facilement les modèles YOLO, en utilisant pleinement le matériel comme les CPU, GPU et NPU pour des applications en temps réel. La boîte à outils Intel OpenVINO, combinée aux modèles Ultralytics YOLO, ouvre de nouvelles possibilités pour apporter des capacités d'IA avancées directement sur les appareils personnels, ce qui en fait une option idéale pour les développeurs désireux de piloter les innovations en IA à travers diverses industries.
Collaborons et innovons ! Visite notre répertoire GitHub pour explorer nos contributions et interagir avec notre communauté. Vois comment nous utilisons l'IA pour avoir un impact dans des secteurs comme la fabrication et la santé.






