Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Exécution des modèles Ultralytics YOLO sur le PC IA d'Intel avec OpenVino

Abirami Vina

4 min de lecture

9 octobre 2024

Revisitez la présentation de Dmitriy Pastushenkov et Adrian Boguszewski, YOLO Vision 2024, sur l'optimisation des modèles YOLO avec Intel OpenVino et l'exécution d'inférences en temps réel sur le PC IA d'Intel.

YOLO Vision 2024 (YV24), l'événement hybride annuel d'Ultralytics, a réuni des passionnés d'IA, des développeurs et des experts du monde entier pour explorer les dernières innovations en matière de vision par ordinateur. YV24 était une excellente opportunité et une plateforme pour discuter des nouvelles avancées. L'événement a mis en vedette des acteurs clés de l'industrie de l'IA présentant leurs dernières innovations. Parmi eux, Intel, qui a participé à l'événement en présentant un exposé sur son nouveau PC IA révolutionnaire et l'intégration d'Intel OpenVino avec les modèles Ultralytics YOLO tels que Ultralytics YOLO11.

La présentation était animée par Adrian Boguszewski, un évangéliste logiciel qui a co-écrit l'ensemble de données LandCover.ai et qui sensibilise les développeurs à la boîte à outils OpenVINO d'Intel, et Dmitriy Pastushenkov, un évangéliste PC IA avec plus de 20 ans d'expérience dans l'automatisation industrielle et l'IA. Pendant l'événement, Adrian a partagé son enthousiasme et a déclaré : "C'est un événement formidable aujourd'hui, non seulement parce qu'Ultralytics a livré une nouvelle version de YOLO, mais aussi parce que nous sommes en mesure de présenter ce nouveau modèle fonctionnant sur notre nouveau matériel, ainsi qu'une nouvelle version d'OpenVINO."

Dans cet article, nous examinerons les principaux points de la présentation d'Intel à YV24, en explorant les tenants et les aboutissants de leur PC AI, l'Intel Core Ultra série 200V, et comment ils s'intègrent aux modèles Ultralytics YOLO à l'aide du toolkit OpenVINO. Commençons !

Technologies d'IA de pointe en 2024

Dmitriy a commencé la présentation en abordant les principales différences entre l'IA traditionnelle et l'IA générative. L'accent a été mis sur la façon dont ces technologies et leurs cas d'utilisation évoluent en 2024. Les techniques d'IA traditionnelles telles que la vision par ordinateur et le traitement du langage naturel ont été essentielles pour des tâches telles que l'estimation de pose, la détection d'objets et la reconnaissance vocale. L'IA générative, cependant, représente une nouvelle vague de technologie d'IA qui implique des applications telles que les chatbots, la génération de texte en image, l'écriture de code et même le texte en vidéo

__wf_reserved_inherit
Fig 1. Adrian et Dmitriy d'Intel, sur scène à YV24, discutant des cas d'utilisation de l'IA.

Dmitriy a souligné la différence d'échelle entre les deux. Il a expliqué que si les modèles d'IA traditionnels sont constitués de millions de paramètres, les modèles d'IA générative fonctionnent à une échelle beaucoup plus grande. Les modèles d'IA générative impliquent souvent des milliards, voire des milliers de milliards de paramètres, ce qui les rend beaucoup plus exigeants en termes de calcul.

Le PC AI d'Intel : Une nouvelle frontière du matériel d'IA

Dmitriy a présenté le PC AI d'Intel comme une nouvelle solution matérielle conçue pour relever les défis croissants de l'exécution efficace des modèles d'IA traditionnels et génératifs. Le PC AI d'Intel est une machine puissante et économe en énergie. Il est capable d'exécuter localement un large éventail de modèles d'IA, sans avoir besoin d'un traitement basé sur le cloud. 

Le traitement local permet de préserver la confidentialité des données sensibles. Lorsque les modèles d'IA peuvent fonctionner indépendamment des connexions Internet, les préoccupations éthiques des industries en matière de confidentialité et de sécurité sont prises en compte.

Le moteur du PC AI d'Intel est le processeur Intel Core Ultra série 200V. Ce processeur intègre trois composants clés : l'unité centrale de traitement (CPU), l'unité de traitement graphique (GPU) et l'unité de traitement neuronal (NPU). Chacun joue un rôle spécifique dans la gestion des différents types de charges de travail d'IA. Le CPU est idéal pour les tâches plus petites, à faible latence, qui nécessitent des réponses rapides, tandis que le GPU est optimisé pour les opérations à haut débit comme l'exécution de modèles d'IA. Le NPU, conçu pour l'efficacité énergétique, est bien adapté aux tâches de longue durée comme la détection d'objets en temps réel avec des modèles comme YOLO11

Il a été souligné que le CPU peut fournir jusqu'à 5 TOPS (Trillions d'opérations par seconde), le GPU jusqu'à 67 TOPS, et le NPU fournit un moyen économe en énergie d'exécuter des tâches d'IA en continu sans épuiser les ressources du système.

Les avancées d'Intel en matière d'IA : Intel Core Ultra série 200V

Le processeur Intel Core Ultra série 200V intègre les trois moteurs d'IA - NPU, CPU et GPU - dans une seule petite puce. Sa conception est parfaitement adaptée aux appareils compacts comme les ordinateurs portables, sans sacrifier les performances.

Le processeur comprend également de la RAM intégrée, ce qui réduit le besoin de cartes graphiques séparées. Cela contribue à réduire la consommation d'énergie et à maintenir la compacité de l'appareil. Dmitriy a également souligné la flexibilité du processeur. Les utilisateurs peuvent décider d'exécuter des modèles d'IA sur le CPU, le GPU ou le NPU, en fonction de la tâche. Par exemple, la détection d'objets avec les modèles YOLO11 peut s'exécuter sur n'importe lequel de ces moteurs, tandis que les tâches plus complexes, comme la génération de texte à partir d'images, peuvent utiliser à la fois le GPU et le NPU simultanément pour de meilleures performances.

Pendant la présentation, Dmitriy a sorti la puce de sa poche, donnant à chacun une idée claire de sa petite taille, malgré sa capacité à gérer des tâches d'IA aussi avancées. C'était une façon amusante et mémorable de montrer comment Intel apporte de puissantes capacités d'IA à des appareils plus portables et pratiques.

__wf_reserved_inherit
Fig 2. Le processeur Intel Core Ultra 2000V peut tenir dans une poche.

Optimisation des modèles d'IA avec Intel OpenVino

Après avoir présenté les dernières avancées matérielles d'Intel, Dmitriy a ensuite abordé la pile logicielle d'Intel qui prend en charge l'IA. Il a présenté OpenVINO, le framework open source d'Intel conçu pour optimiser et déployer efficacement des modèles d'IA sur différents appareils. OpenVINO va au-delà des tâches visuelles, étendant sa prise en charge aux modèles d'IA utilisés pour le traitement du langage naturel, le traitement audio, les transformers, etc.

OpenVINO est compatible avec les plateformes populaires comme PyTorch, TensorFlow et ONNX, et les développeurs peuvent facilement l'intégrer à leurs flux de travail. Une caractéristique clé qu'il a soulignée est la quantification. La quantification compresse les poids du modèle pour réduire leur taille, de sorte que les grands modèles peuvent fonctionner sans problème sur les appareils locaux sans avoir besoin du cloud. OpenVINO fonctionne sur plusieurs frameworks, s'exécutant sur CPU, GPU, NPU, FPGA ou même des appareils ARM, et prend en charge Windows, Linux et macOS. Dmitriy a également expliqué au public à quel point il est facile de commencer avec OpenVINO. 

__wf_reserved_inherit
Fig 3. Dmitriy expliquant comment démarrer avec OpenVino.

Intégration d'Ultralytics avec Intel OpenVino

Dans la deuxième partie de la présentation, le micro a été passé à Adrian, qui a expliqué l'intégration transparente entre les modèles Ultralytics YOLO et la boîte à outils OpenVINO d'Intel, simplifiant ainsi le processus de déploiement des modèles YOLO. Il a fourni une explication étape par étape de la façon dont l'exportation d'un modèle YOLO à l'aide du package Python Ultralytics au format OpenVINO est rapide et simple. Cette intégration permet aux développeurs d'optimiser plus facilement leurs modèles pour le matériel Intel et de tirer le meilleur parti des deux plateformes.

__wf_reserved_inherit
Fig 4. Adrian expliquant comment Ultralytics facilite l'exportation de votre modèle au format OpenVino.

Adrian a démontré qu'une fois qu'un modèle Ultralytics YOLO est entraîné, les utilisateurs peuvent l'exporter en utilisant quelques indicateurs de ligne de commande simples. Par exemple, les utilisateurs peuvent spécifier s'ils veulent exporter le modèle en tant que version à virgule flottante pour une précision maximale ou en tant que version quantifiée pour une meilleure vitesse et efficacité. Il a également souligné comment les développeurs peuvent gérer ce processus directement via le code, en utilisant des options comme la quantification INT8 pour améliorer les performances sans sacrifier trop de précision. 

Démos d'IA en temps réel sur le PC Intel AI

Pour mettre toute cette théorie en pratique, l'équipe Intel a présenté une démo en temps réel de détection d'objets en exécutant YOLO11 sur le PC Intel AI. Adrian a montré comment le système gérait le modèle sur différents processeurs, atteignant 36 images par seconde (FPS) sur le CPU avec un modèle à virgule flottante, plus de 100 FPS sur le GPU intégré et 70 FPS avec la version quantifiée INT8. Ils ont pu démontrer l'efficacité avec laquelle le PC Intel AI peut gérer des tâches d'IA complexes.

Il a également souligné que le système peut exécuter des modèles en parallèle, en utilisant le CPU, le GPU et le NPU ensemble pour les tâches où toutes les données ou les trames vidéo sont disponibles dès le départ. Ceci est utile lors du traitement de charges lourdes comme les vidéos. Le système peut répartir la charge de travail sur différents processeurs, ce qui le rend plus rapide et plus efficace.

Pour conclure, Adrian a mentionné que les utilisateurs pouvaient essayer des démos à domicile, y compris des solutions telles que le comptage de personnes et la gestion intelligente des files d'attente. Il a ensuite montré une démo bonus où les utilisateurs pouvaient entrer des invites pour générer des images oniriques en temps réel sur le GPU. Cela a démontré la polyvalence du PC Intel AI pour les tâches d'IA traditionnelles et les projets d'IA générative créatifs.

Détection d'objets en temps réel avec Intel OpenVINO

Lors de l'événement, Intel avait un stand où ils ont présenté une démo de détection d'objets en temps réel utilisant YOLO11, fonctionnant sur leur PC Intel AI. Les participants ont pu voir le modèle en action, optimisé avec OpenVINO, et déployé sur le processeur Intel Core Ultra 200V. 

__wf_reserved_inherit
Fig 5. Les participants ont eu l'occasion de voir une démo en temps réel au stand Intel OpenVino.

Au stand Intel, Dmitry a partagé : "C'est ma première fois à YOLO Vision, et je suis heureux d'être à Madrid. Nous présentons le modèle YOLO11 d'Ultralytics, fonctionnant sur le processeur Intel Core Ultra 200V. Il affiche d'excellentes performances, et nous utilisons OpenVINO pour optimiser et déployer le modèle. Il a été très facile de collaborer avec Ultralytics et d'exécuter le modèle sur le dernier matériel Intel, en utilisant le CPU, le GPU et le NPU." Le stand proposait également des cadeaux amusants, tels que des t-shirts et des cahiers que les participants pouvaient emporter chez eux.

Principaux points à retenir

La présentation technique d'Intel à YV24, mettant en vedette les processeurs Intel Core Ultra série 200V, a montré comment la boîte à outils OpenVINO optimise les modèles d'IA comme Ultralytics YOLO11. Cette intégration permet aux utilisateurs d'exécuter des modèles YOLO directement sur leurs appareils, offrant d'excellentes performances pour les tâches de vision par ordinateur comme la détection d'objets. L'avantage principal est que les utilisateurs n'ont pas besoin de dépendre des services cloud.

Les développeurs et les passionnés d'IA peuvent exécuter et affiner facilement les modèles YOLO, en utilisant pleinement le matériel comme les CPU, les GPU et les NPU pour les applications en temps réel. La boîte à outils Intel OpenVINO, en combinaison avec les modèles Ultralytics YOLO, ouvre de nouvelles possibilités pour apporter des capacités d'IA avancées directement aux appareils personnels, ce qui en fait une option idéale pour les développeurs désireux de stimuler les innovations en matière d'IA dans divers secteurs.

Collaborons et innovons ! Visitez notre dépôt GitHub pour explorer nos contributions et interagir avec notre communauté. Découvrez comment nous utilisons l'IA pour avoir un impact dans des secteurs tels que la fabrication et la santé.

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement
Lien copié dans le presse-papiers