Déployer Ultralytics YOLO11 en toute transparence grâce à l'intégration MNN

Abirami Vina

4 min lire

25 juin 2025

Découvrez comment exporter et déployer les modèles Ultralytics YOLO11 avec l'intégration MNN pour une inférence rapide sur les plates-formes mobiles, embarquées et à faible consommation d'énergie.

Aujourd'hui, les innovations en matière d'IA vont au-delà des environnements de serveurs distants. Les solutions d'IA sont intégrées dans des dispositifs périphériques tels que les capteurs et les smartphones. Grâce à cette évolution technologique, les données peuvent désormais être traitées directement là où elles sont générées, ce qui permet d'accélérer les réponses, d'améliorer la confidentialité et de réduire la dépendance à l'égard d'une connectivité constante dans le nuage.

Par conséquent, l'IA périphérique gagne du terrain dans de nombreux secteurs. Le marché des logiciels d'IA périphérique devrait atteindre 8,88 milliards de dollars d'ici 2031, car de plus en plus de systèmes s'orientent vers un traitement plus rapide et plus local.

En particulier, la vision par ordinateur, une branche de l'IA qui se concentre sur la compréhension des images et de la vidéo, est rapidement adoptée à la périphérie. Qu'il s'agisse de compter les aliments lors de leur conditionnement ou d'aider les véhicules à détecter les piétons, la vision par ordinateur prend en charge d'innombrables applications pratiques dans différents secteurs.

Cela est possible grâce à des modèles de vision artificielle. Par exemple, Ultralytics YOLO11 est un modèle qui prend en charge diverses tâches de vision artificielle telles que la détection d'objets, la segmentation d'instances, le suivi d'objets et l'estimation de la pose. Il est conçu pour être rapide et efficace et fonctionne bien sur des appareils aux ressources matérielles limitées.

Fig. 1. Détection et suivi des aliments emballés à l'aide de YOLO11(Source).

En plus d'être adapté au déploiement en périphérie, YOLO11 peut être exporté dans divers formats adaptés à différents environnements matériels grâce à diverses intégrations prises en charge par Ultralytics. 

L'une des options les plus efficaces est MNN (Mobile Neural Network), un moteur d'inférence léger conçu pour les appareils à faibles ressources. L'exportation de YOLO11 vers MNN lui permet de fonctionner directement sur les téléphones portables, les systèmes embarqués et d'autres plates-formes de pointe où un traitement rapide sur l'appareil est essentiel.

Dans cet article, nous allons explorer le fonctionnement de l'intégration MNN, mettre en évidence les cas d'utilisation courants et expliquer comment commencer à exécuter des inférences à l'aide d'un modèle YOLO11 exporté. Commençons par le commencement !

Vue d'ensemble de MNN : Un cadre d'apprentissage profond

Il n'est pas toujours facile d'exécuter des modèles de vision par ordinateur sur des appareils de petite taille comme les téléphones mobiles, les capteurs industriels et les systèmes portables. Ces appareils ont souvent une mémoire limitée, des processeurs plus lents et des limites d'énergie strictes. 

Le réseau neuronal mobile, ou MNN, est un moteur d'inférence léger et performant développé par Alibaba pour faire fonctionner efficacement les modèles d'intelligence artificielle sur du matériel à faibles ressources tout en maintenant des performances en temps réel. Le MNN prend en charge un large éventail de plateformes, notamment Android, iOS et Linux, et fonctionne sur différents types de matériel tels que les unités centrales de traitement (CPU) et les unités de traitement graphique (GPU).

Fig. 2. Aperçu du cadre du MNN(Source).

L'intégration MNN prise en charge par Ultralytics permet d'exporter facilement les modèles YOLO11 vers le format MNN. En d'autres termes, les modèles peuvent être convertis du format YOLO au format MNN. 

Une fois convertis, ils peuvent être déployés sur des appareils qui prennent en charge le cadre MNN pour une inférence efficace sur l'appareil. L'un des principaux avantages de l'utilisation du format MNN est qu'il simplifie le déploiement de YOLO11 dans des scénarios où la taille, la vitesse et l'efficacité des ressources sont essentielles.

Principales caractéristiques du backend d'inférence MNN

Avant de voir comment utiliser l'intégration MNN, examinons ce qui fait du framework MNN un excellent choix pour l'exécution de modèles d'IA sur des appareils du monde réel. Il est conçu pour gérer les contraintes uniques des environnements périphériques tout en offrant des performances rapides et fiables.

Il est intéressant de noter que MNN est utilisé en interne par Alibaba dans plus de 30 applications, dont Taobao, Tmall, Youku, DingTalk et Xianyu, dans un large éventail de scénarios tels que la vidéo en direct, les contenus courts, la recherche d'images et les contrôles de sécurité sur les appareils. Il permet un déploiement à grande échelle et exécute des millions d'inférences par jour dans des environnements de production.

Voici quelques-unes des principales caractéristiques du cadre MNN :

  • Sélection automatique du backend : MNN peut choisir automatiquement le backend d'exécution le plus approprié, tel que le CPU ou le GPU, en fonction du matériel sur lequel il fonctionne.
  • Exécution multithread: Il prend en charge le multithreading, ce qui lui permet de tirer pleinement parti des processeurs multicœurs pour une inférence plus rapide.
  • Prise en charge de la quantification du modèle: Il vous permet de réduire considérablement la taille du modèle en utilisant la quantification FP16 ou INT8, ce qui permet d'améliorer la vitesse d'inférence tout en utilisant moins de mémoire.
  • Léger et rapide : MNN a un très faible encombrement, avec une bibliothèque centrale d'environ 400 Ko sur Android et d'environ 5 Mo sur iOS, ce qui le rend idéal pour les appareils mobiles et embarqués.

Comprendre le fonctionnement de l'intégration du MNN

Ensuite, nous allons voir comment exporter les modèles YOLO11 au format MNN.

La première étape consiste à installer le paquetage Python Ultralytics, qui fournit tout ce qui est nécessaire pour exporter les modèles YOLO11 au format MNN. Vous pouvez le faire en exécutant "pip install ultralytics" dans votre terminal ou en utilisant l'invite de commande. Si vous utilisez un Jupyter Notebook ou Google Colab, ajoutez un point d'exclamation avant la commande.

Si vous rencontrez des problèmes lors de l'installation, consultez le guide des problèmes courants pour obtenir des conseils de dépannage.

Une fois votre environnement configuré, vous pouvez charger un modèle YOLO11 pré-entraîné tel que "yolo11n.pt" et l'exporter au format MNN comme le montre l'extrait de code ci-dessous. Si vous avez entraîné votre propre modèle YOLO11, vous pouvez l'exporter en remplaçant simplement le nom du fichier par le chemin d'accès à votre modèle.

from ultralytics import YOLO
model = YOLO("yolo11n.pt")
model.export(format="mnn")

Après avoir converti votre modèle en MNN, vous pouvez l'utiliser sur différentes plateformes mobiles et embarquées en fonction des besoins de votre application.

Par exemple, supposons que vous souhaitiez tester le modèle exporté sur une vidéo de la circulation. Dans ce cas, vous pouvez charger le modèle YOLO11 au format MNN pour détecter des objets tels que des véhicules, des piétons et des panneaux de signalisation directement sur l'appareil, comme le montre l'exemple ci-dessous.

mnn_model = YOLO("yolo11n.mnn")
results = mnn_model("https://videos.pexels.com/video-files/27783817/12223745_1920_1080_24fps.mp4", save=True)

Lorsque l'inférence est terminée, la vidéo de sortie avec les objets détectés est enregistrée automatiquement dans le dossier "runs/detect/predict". Par ailleurs, si vous souhaitez exécuter l'inférence en utilisant directement le paquetage Python MNN, vous pouvez consulter la documentation officielle d'Ultralytics pour plus de détails et d'exemples.

Fig. 3. Analyse du trafic à l'aide d'un modèle YOLO11 exporté au format MNN. Image de l'auteur.

Cas d'utilisation du déploiement d'un modèle d'IA de pointe rendu possible par YOLO11 et MNN

Le déploiement de YOLO11 avec MNN permet d'effectuer rapidement et efficacement des tâches de vision artificielle telles que la détection d'objets dans des environnements où le traitement basé sur le cloud n'est pas pratique ou possible. Voyons comment cette intégration peut être particulièrement utile dans des scénarios réels.

L'IA mobile pour l'identification des maladies des plantes

Les applications d'identification des maladies des plantes qui utilisent la classification des images gagnent en popularité parmi les jardiniers, les chercheurs et les amateurs de nature. Avec une simple photo, les utilisateurs peuvent rapidement identifier les premiers signes de maladie, tels que les taches ou la décoloration des feuilles. Comme ces applications sont souvent utilisées dans des zones extérieures où l'accès à l'internet peut être limité ou indisponible, le recours au traitement en nuage peut s'avérer peu fiable.

Après l'entraînement, un modèle YOLO11 peut être exporté au format MNN et exécuté directement sur des appareils mobiles. Le modèle peut alors classer les espèces végétales et détecter les symptômes de maladies visibles localement, sans envoyer de données à un serveur. 

Fig. 4. Exemple d'utilisation de YOLO11 pour détecter des signes de rouille (une maladie végétale) sur une feuille(Source).

Inférences efficaces sur l'appareil dans le domaine de la fabrication

Un suivi précis des colis est essentiel sur les chaînes de production à forte activité dans les usines de fabrication. YOLO11 peut être utilisé pour suivre et compter chaque article lorsqu'il passe par les points de contrôle clés, en mettant à jour les comptages en temps réel et en signalant toute anomalie. Cela permet de réduire le nombre d'envois manqués ou non comptabilisés et de favoriser des opérations plus fluides et plus fiables.

Fig. 5. Suivi et comptage des colis à l'aide de YOLO11(Source).

L'intégration de MNN peut avoir un impact particulier dans ce contexte. Une fois que le modèle YOLO11 est exporté au format MNN, il peut fonctionner directement sur des appareils compacts et de faible puissance installés le long du convoyeur. 

Comme tous les traitements sont effectués localement, le système peut fournir un retour d'information instantané et ne nécessite pas de connexion Internet. Cela garantit des performances rapides et fiables dans l'atelier, permettant à la production de se dérouler efficacement tout en maintenant une précision et un contrôle élevés.

Avantages de l'exportation de YOLO11 vers le format de modèle MNN

Voici quelques avantages clés de l'intégration de MNN fournie par Ultralytics :

  • Des temps de réponse plus rapides: Comme l'inférence s'effectue sur l'appareil, les prédictions se font en temps réel avec une latence minimale.
  • Amélioré confidentialité des données: Les données restent sur l'appareil, ce qui réduit la nécessité d'envoyer des images ou des vidéos sensibles dans le nuage.
  • Source ouverte et maintenance active: Soutenu par Alibaba et par une communauté active, MNN est fiable et régulièrement mis à jour avec des améliorations de performance.

Facteurs à prendre en compte lors de l'utilisation du cadre MNN

Avant de choisir MNN comme cadre de déploiement, il est également important d'évaluer dans quelle mesure il répond aux exigences de votre projet, aux objectifs de déploiement et aux limitations techniques. Voici quelques facteurs clés à prendre en compte :

  • Compatibilité permanente : Les mises à jour du cadre ou les changements apportés à vos plateformes cibles peuvent nécessiter de nouveaux tests ou des ajustements pour que tout fonctionne correctement.
  • Moins d'outils de débogage : Par rapport aux frameworks plus importants, MNN dispose d'outils plus limités pour le débogage et l'inspection du comportement du modèle, ce qui peut rendre le dépannage plus difficile.
  • Les performances dépendent du matériel : La vitesse et l'efficacité de votre modèle varient en fonction de l'appareil. Testez votre matériel cible pour vous assurer qu'il répond à vos objectifs de performance.

Principaux enseignements

La prise en charge de l'intégration MNN par Ultralytics facilite l'exportation des modèles YOLO11 pour une utilisation sur des appareils mobiles et embarqués. Il s'agit d'une option pratique pour les applications qui nécessitent une détection rapide et fiable sans dépendre d'un accès au cloud ou d'une connectivité constante.

Cette configuration permet de rationaliser le déploiement tout en maintenant les performances et en limitant les demandes de ressources. Que vous construisiez des systèmes domestiques intelligents, des outils de terrain ou des appareils industriels compacts, l'exportation de YOLO11 vers MNN constitue un moyen souple et efficace d'exécuter des tâches de vision par ordinateur directement sur des appareils périphériques.

Rejoignez notre communauté grandissante ! Explorez notre dépôt GitHub pour approfondir votre connaissance de l'IA. Prêt à démarrer vos projets de vision par ordinateur ? Consultez nos options de licence. Pour en savoir plus sur l'IA dans le secteur de la santé et sur la vision par ordinateur dans le secteur de la vente au détail, consultez nos pages consacrées aux solutions !

Construisons ensemble le futur
de l'IA !

Commencez votre voyage avec l'avenir de l'apprentissage automatique

Commencer gratuitement
Lien copié dans le presse-papiers