Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Comment Ultralytics simplifie le déploiement des modèles de vision par ordinateur

Découvrez comment Ultralytics rassemble tout ce dont vous avez besoin pour le déploiement de modèles de vision par ordinateur, des tests aux API prêtes à l'emploi.

Développez vos projets de vision par ordinateur avec Ultralytics

Démarrer

Ultralytics depuis des années avec la communauté de la vision par ordinateur, Ultralytics créant des modèles et des outils qui rendent l'IA appliquée à la vision plus accessible à tous. Avec Ultralytics , nous allons encore plus loin en regroupant l'ensemble du processus de développement de la vision par ordinateur au sein d'un environnement unifié, couvrant tous les aspects, de la gestion et de l'annotation des ensembles de données à l'entraînement, la validation et le déploiement des modèles.

Nous sommes notamment ravis de faciliter le déploiement des modèles de vision par ordinateur. Alors que la vision par ordinateur continue de s'imposer dans les applications concrètes, l'analyse d'images et de vidéos en dehors d'environnements contrôlés reste complexe. 

Contrairement aux environnements de test où les conditions sont prévisibles, les scénarios réels sont caractérisés par des conditions d'éclairage variables, des données d'entrée changeantes et des charges de travail imprévisibles, ce qui fait du déploiement l'une des étapes les plus complexes du flux de travail de vision.

Le déploiement ne se limite pas à mettre un modèle à disposition. Il nécessite la mise en place de processus capables de traiter des données réelles et de garantir un fonctionnement sans heurts à mesure que l'utilisation augmente et que les projets prennent de l'ampleur. 

Les équipes doivent également track et garantir la fiabilité à long terme. Cela implique souvent de passer d'un outil d'IA à un autre pour les phases de test, d'intégration, de déploiement et de surveillance, ce qui peut ralentir le développement des modèles et ajouter une complexité inutile.

Les flux de travail finissent par se fragmenter. Ultralytics harmonise et simplifie ce processus.

Il offre une prise en charge intégrée de la mise en service, des tests et de la surveillance des modèles au sein d'un environnement unique. Les équipes peuvent valider les modèles à l'aide d'une inférence via navigateur, les intégrer dans des applications grâce à des services d'inférence partagés, et les déployer sur des terminaux dédiés avec des fonctionnalités de surveillance des performances.

Fig. 1. Aperçu de la page de déploiement au sein de Ultralytics (Source)

Dans cet article, nous allons voir comment Ultralytics redéfinit le déploiement des modèles de vision par ordinateur , depuis les tests et l'intégration jusqu'au déploiement en production et à la surveillance. C'est parti !

Aperçu du déploiement des modèles de vision par ordinateur

Dans le cycle de vie de l'apprentissage automatique, le déploiement d'un modèle correspond à l'étape où celui-ci passe de la phase d'expérimentation à une utilisation concrète. Pour les modèles de vision par ordinateur développés à l'aide de l'apprentissage profond et de réseaux neuronaux convolutifs, cela implique généralement de les rendre opérationnels pour traiter des images et des vidéos en temps réel.

Une fois déployés, ces modèles traitent de nouvelles données, qui sont généralement soumises à des étapes de prétraitement telles que le redimensionnement, la normalisation ou le formatage. Les données traitées sont ensuite transmises au modèle, qui applique les schémas appris lors de l'entraînement pour générer des prévisions de haute précision.

Selon le cas d'utilisation, cela peut inclure différentes tâches de vision par ordinateur. Par exemple,YOLO Ultralytics YOLO , tels que Ultralytics , prennent en charge un large éventail de tâches de vision, notamment la détection d'objets, la classification d'images, la segmentation d'instances, l'estimation de la pose et la détection de cadres de sélection orientés (OBB).

Pour que cela soit applicable dans la pratique, les modèles doivent souvent être intégrés à des systèmes capables de gérer efficacement à la fois le prétraitement et l'inférence. C'est là que l'infrastructure de déploiement devient indispensable.

Dans les environnements de production, l'accès aux modèles s'effectue généralement via des API REST ou des systèmes de mise à disposition de modèles. Ces interfaces permettent aux applications d'envoyer des données et de recevoir des prédictions par programmation, ce qui facilite l'intégration avec des applications externes, des appareils IoT ou des systèmes robotiques qui s'appuient sur la compréhension visuelle en temps réel.

Limites des outils traditionnels de déploiement de la vision par ordinateur

Le déploiement d'un modèle de vision par ordinateur peut sembler simple, mais jusqu'à présent, la réalité s'est avérée bien différente. Prenons un scénario courant : les données sont d'abord capturées par des caméras ou des capteurs, puis transmises à un modèle pour l'inférence, avant d'être renvoyées à une application sous forme de prédictions.

En réalité, chacune de ces étapes est souvent gérée par des outils et des services distincts. Un système peut se charger de la collecte des données, un autre de la mise à disposition des modèles, tandis que d'autres outils sont utilisés pour la mise à l'échelle, la surveillance et la journalisation. Assurer la connexion et le bon fonctionnement de ces composants peut rapidement devenir complexe.

À mesure que l'utilisation se généralise, cette complexité s'accroît. La gestion de l'infrastructure, la gestion des dépendances et le maintien de performances constantes tout au long du pipeline peuvent ralentir le développement et compliquer le déploiement des modèles de vision par ordinateur dans des applications concrètes.

Ultralytics rassemble ces composants au sein d'un environnement unique et unifié. Cela permet de gérer l'ensemble du processus de déploiement de manière plus cohérente, tout en garantissant performances et fiabilité à grande échelle.

Options de déploiement de modèles offertes par Ultralytics

Outre l'harmonisation du processus de déploiement des modèles, Ultralytics offre également une grande souplesse dans la manière dont les modèles sont déployés et utilisés.

Pour accompagner les différentes étapes du déploiement des modèles de vision par ordinateur, la plateforme propose quatre options : des tests via navigateur avec inférence instantanée, une inférence partagée via des API pour le développement, des points de terminaison dédiés pour des déploiements en production évolutifs dans toutes les régions du monde, et l'exportation de modèles pour les exécuter sur une infrastructure externe ou des appareils en périphérie.

Voyons donc de plus près comment chacune de ces options fonctionne.

Validez rapidement vos modèles à l'aide de l'onglet « Predict »

Avant de mettre un modèle en production, il est important de comprendre comment il se comporte sur des données nouvelles et inconnues. Ultralytics intègre un onglet « Predict » qui vous permet d'effectuer des inférences directement dans le navigateur, sans aucune configuration, infrastructure ni dépendance.

L'onglet « Predict » permet une validation rapide et interactive du modèle. Vous pouvez télécharger des images, utiliser des exemples préchargés ou capturer des données d'entrée à l'aide d'une webcam ; l'inférence s'exécute automatiquement dès que les données sont fournies. 

Les résultats s'affichent instantanément, accompagnés de superpositions visuelles, de scores de confiance et de rapports détaillés, vous offrant ainsi une vision claire du comportement du modèle.

Fig. 2. Exemple de validation d'un modèle à l'aide de l'onglet « Predict » (Source)

Cela signifie qu'en quelques clics, vous pouvez tester différentes données d'entrée, ajuster les paramètres et évaluer les performances au sein d'une seule et même interface avant de passer au déploiement.

Exécution d'inférences partagées à des fins de test ou pour une utilisation peu intensive

Imaginons que vous ayez entraîné un modèle et que vous l'ayez validé à l'aide de l'onglet « Predict ». L'étape suivante consiste souvent à commencer à intégrer ce modèle dans une application ou un flux de travail. 

Au lieu de mettre en place une infrastructure ou de gérer des serveurs, Ultralytics fournit des services d'inférence partagés qui vous permettent d'envoyer des données à votre modèle et de recevoir des prédictions via de simples API REST.

En arrière-plan, l'inférence partagée s'exécute sur un système multi-locataires couvrant plusieurs régions principales, où les requêtes sont automatiquement acheminées vers le service disponible le plus proche. Cela permet de garantir des performances réactives tout en offrant aux utilisateurs situés dans différents endroits un accès homogène aux modèles.

Vous pouvez envoyer des données d'entrée via des requêtes HTTP standard et recevoir en retour des résultats structurés, ce qui facilite grandement l'intégration des modèles dans des applications, des scripts ou des flux de travail automatisés. Cette configuration constitue une excellente option pour le développement, les tests, les intégrations ou une utilisation à petite échelle avant de passer à des déploiements de production plus évolutifs.

Déployer des modèles à l'échelle mondiale via des points de terminaison dédiés

Une fois qu'un modèle est prêt pour la production, il doit être capable de traiter le trafic réel de manière fiable et à grande échelle. Ultralytics y parvient grâce à des points de terminaison dédiés, où les modèles s'exécutent sous forme de services à locataire unique dans 43 régions du monde. Le déploiement à proximité des utilisateurs finaux permet de réduire la latence et de garantir des performances constantes d'un site à l'autre.

Chaque nœud dispose de ses propres ressources de calcul et d'une URL unique pour les requêtes d'inférence. Ce niveau de contrôle facilite l'adaptation des déploiements en fonction des besoins de performance, qu'il s'agisse de cas d'utilisation légers ou d'applications plus exigeantes à haut débit nécessitant davantage de ressources de calcul.

Fig. 3. Ultralytics vous permet de déployer des modèles dans 43 régions à travers le monde (Source)

Cependant, les terminaux dédiés sont conçus pour gérer eux-mêmes les fluctuations de charge, grâce à une mise à l'échelle automatique qui adapte les ressources en fonction du trafic entrant. Ils augmentent leur capacité en période de forte demande et la réduisent lorsque l'activité diminue. La mise à l'échelle jusqu'à zéro étant activée par défaut, les terminaux inactifs s'arrêtent automatiquement et redémarrent dès l'arrivée de nouvelles requêtes, ce qui permet d'optimiser l'utilisation des ressources sans intervention manuelle.

Exportez facilement votre modèle grâce à Ultralytics

De nos jours, l'IA en périphérie devient de plus en plus indispensable, car un nombre croissant d'applications s'appuient sur l'exécution de modèles directement sur des appareils tels que les smartphones, les appareils photo et les systèmes embarqués. L'exécution locale des modèles permet également de répondre aux exigences en matière de confidentialité des données, puisque les données sensibles, telles que les images ou les flux vidéo, peuvent être traitées directement sur l'appareil sans être transmises à des serveurs externes.

Dans ces cas de figure, les modèles doivent être exécutés en dehors de Ultralytics , ce qui fait de l'exportation des modèles une étape cruciale du processus de déploiement.YOLO Ultralytics sont souvent entraînés à l'aide de Python PyTorch, puis peuvent être exportés vers plus de 17 formats différents, notamment ONNX, TensorRT, CoreML et OpenVINO. 

Cette large gamme de formats garantit la compatibilité avec divers matériels, des processeurs graphiques (GPU) haute performance aux appareils mobiles et embarqués. De plus, l'exportation permet d'optimiser les performances pour des environnements spécifiques. 

Selon le format utilisé, les modèles peuvent atteindre des vitesses d'inférence plus élevées, par exemple grâce à l'amélioration GPU avec TensorRT à l'optimisation CPU avec ONNX OpenVINO. Des options telles que la quantification FP16 et INT8 permettent de réduire davantage la taille des modèles et d'améliorer le débit, ce qui s'avère particulièrement utile pour les déploiements en périphérie.

Sur Ultralytics , la fonction d'exportation est directement intégrée au flux de travail, ce qui permet de générer rapidement des modèles optimisés en quelques clics seulement. Les équipes peuvent passer de la phase d'entraînement à l'exécution des modèles sur des systèmes externes sans alourdir leur charge de travail.

Fig. 4. Une sélection de formats d'exportation sur Ultralytics .

Choisir la bonne option de déploiement du modèle

Chaque option de déploiement de Ultralytics correspond à une étape différente du flux de travail, depuis les premiers tests jusqu'à la mise en production. Voici un aperçu des situations dans lesquelles vous pourriez utiliser chacune d'entre elles :

  • Onglet « Predict »: cet onglet est généralement utilisé juste après l'entraînement ou le réglage fin, lorsque vous souhaitez vérifier les performances d'un modèle sur de nouvelles données à l'aide d'une inférence via navigateur.
  • Inférence partagée: à ce stade, les modèles peuvent être intégrés dans des applications via des API, ce qui permet de tester les interactions en conditions réelles dès la phase de développement.
  • Terminaux dédiés: ils sont utilisés pour les déploiements en production, où les modèles nécessitent des performances constantes, des ressources dédiées et la possibilité d'évoluer à l'échelle mondiale.
  • Exportation de modèles: lorsque les modèles doivent être exécutés en dehors de la plateforme, la possibilité de les exporter permet leur déploiement sur des appareils périphériques, des applications mobiles ou une infrastructure personnalisée.

Les équipes passent souvent par ces différentes étapes les unes après les autres, de la validation à l'intégration, puis au déploiement en production, le tout au sein de la plateforme.

Suivi des modèles déployés via Ultralytics

Même si le déploiement est essentiel, le processus de développement ne s'arrête pas là. Une fois qu'un modèle est opérationnel en production, une surveillance continue est indispensable pour garantir sa fiabilité à long terme.

Ultralytics propose des outils de surveillance intégrés qui offrent aux équipes une visibilité claire sur l'évolution de leurs modèles d'IA visuelle au fil du temps, favorisant ainsi un processus de MLOps (opérations d'apprentissage automatique) plus structuré.

La page « Déploiement » comprend un tableau de bord qui permet de suivre des indicateurs clés tels que le nombre total de requêtes, les déploiements actifs, le temps de réponse et les taux d'erreur. Ces informations aident les équipes à comprendre les habitudes d'utilisation, à évaluer la réactivité du système et à garantir des performances à faible latence pour différentes charges de travail.

Fig. 5. Ultralytics facilite la surveillance des modèles déployés. (Source)

Chaque point de terminaison dédié offre également une visibilité détaillée grâce à des vues de déploiement individuelles. Cela inclut l'accès aux journaux, à l'état de santé des modèles et aux données de performance en temps réel. Les journaux peuvent être utilisés pour déboguer des problèmes, retracer les requêtes ayant échoué et identifier les problèmes potentiels liés aux dépendances ou à l'infrastructure.

À mesure que les environnements de production évoluent, des facteurs tels que la modification des données d'entrée, l'augmentation des besoins en capacité ou l'évolution des habitudes d'utilisation peuvent avoir une incidence sur la précision et la robustesse des modèles. En surveillant en permanence les indicateurs de performance, les équipes peuvent detect , identifier les goulots d'étranglement et prendre des mesures correctives, telles que l'optimisation des modèles ou l'ajustement des ressources, afin de garantir une mise à disposition des modèles cohérente et fiable.

Intégrer l'évolutivité dans le déploiement des modèles de vision par ordinateur

La mise à l'échelle des systèmes de vision par ordinateur a longtemps consisté à assembler des flux de travail et des frameworks qui n'avaient jamais été conçus pour fonctionner ensemble. Les pipelines de données, les boucles d'apprentissage, l'infrastructure de déploiement et les systèmes de surveillance sont souvent dispersés, ce qui engendre des frictions à chaque étape.

Le véritable défi ne consiste pas seulement à créer des modèles, mais à les maintenir en état de fonctionnement. Il s'agit de passer des données à la mise en production, de s'adapter à de nouvelles données d'entrée, de répondre à une demande croissante et de s'améliorer en permanence sans ralentir.

Ce qui distingue Ultralytics , c'est que ce processus est intégré. Au lieu de considérer chaque étape comme une phase distincte, elle les relie en une boucle continue où les modèles peuvent être développés, déployés, surveillés et mis à jour au sein d'un même environnement.

Cette évolution modifie la manière dont les équipes s'adaptent à la croissance. Il ne s'agit plus d'orchestrer des outils ou l'infrastructure, mais de maintenir la dynamique à mesure que les systèmes se développent.

Principaux points à retenir

Pour intégrer des modèles d'apprentissage automatique, tels que les modèles de vision par ordinateur, dans des applications concrètes, il faut qu'ils soient fiables, évolutifs et faciles à gérer. Ultralytics simplifie ce processus en regroupant diverses fonctions, telles que la mise à disposition, le déploiement et la surveillance des modèles, au sein d'un environnement unifié. Grâce à des options de déploiement flexibles et à des outils intégrés, les équipes peuvent passer de la phase d'expérimentation à la production plus rapidement et avec moins de complexité.

Découvrez notre communauté et explorez notre dépôt GitHub pour en savoir plus. Parcourez nos pages consacrées aux solutions pour découvrir diverses applications, telles que l'IA dans le secteur de la santé et la vision par ordinateur dans la logistique. Découvrez nos options de licence et lancez-vous dès aujourd'hui ! 

Construisons ensemble l'avenir de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique