Plateforme Ultralytics

Comment la plateforme Ultralytics simplifie le déploiement de modèles de vision par ordinateur

Vois comment la plateforme Ultralytics rassemble tout ce qui est nécessaire au déploiement de modèles de vision par ordinateur, des tests aux API prêtes pour la production.

ABAbirami Vina

6 min readMarch 24, 2026

Déployer des modèles de vision par ordinateur avec la plateforme Ultralytics

Ultralytics travaille depuis des années avec la communauté de la vision par ordinateur, créant des modèles et des outils qui rendent l'IA visuelle plus accessible à tous. Avec la plateforme Ultralytics, nous allons encore plus loin en réunissant l'intégralité du flux de travail de développement de la vision par ordinateur dans un environnement unifié, couvrant tout, de la gestion et l'annotation des jeux de données à l'entraînement, la validation et le déploiement des modèles.

Nous sommes particulièrement heureux de faciliter le déploiement de modèles de vision par ordinateur. Alors que la vision par ordinateur continue de s'intégrer dans des applications concrètes, l'analyse d'images et de vidéos en dehors d'environnements contrôlés reste complexe.

Contrairement aux configurations de test où les conditions sont prévisibles, les scénarios réels impliquent un éclairage variable, des entrées changeantes et des charges de travail imprévisibles, ce qui fait du déploiement l'une des parties les plus difficiles du flux de travail de vision.

Le déploiement ne se limite pas à rendre un modèle disponible pour utilisation. Il nécessite la mise en place de processus capables de gérer des données réelles et de s'assurer que tout fonctionne sans accroc à mesure que l'utilisation augmente et que les projets se développent.

Les équipes doivent également suivre les performances et maintenir la fiabilité au fil du temps. Cela signifie souvent jongler entre différents outils d'IA pour les tests, l'intégration, le déploiement et la surveillance, ce qui peut ralentir le développement des modèles et ajouter une complexité inutile.

Les flux de travail finissent par devenir fragmentés. La plateforme Ultralytics unifie et simplifie ce processus.

Elle fournit un support intégré pour la mise en service, le test et la surveillance des modèles au sein d'un environnement unique. Les équipes peuvent valider des modèles en utilisant l'inférence basée sur le navigateur, les intégrer dans des applications via des services d'inférence partagés et les déployer sur des terminaux dédiés avec des capacités de surveillance des performances.

La page de déploiement au sein d'Ultralytics Platform

Fig 1. Un aperçu de la page de déploiement au sein de la plateforme Ultralytics (Source)

Dans cet article, nous allons explorer comment la plateforme Ultralytics redéfinit le déploiement de modèles de vision par ordinateur, des tests et de l'intégration au déploiement en production et à la surveillance. Commençons !

Link to this sectionUn aperçu du déploiement de modèles de vision par ordinateur#

Dans le cycle de vie de l'apprentissage automatique, le déploiement de modèle est l'étape où un modèle passe de l'expérimentation à une utilisation réelle. Pour les modèles de vision par ordinateur construits à l'aide de l'apprentissage profond et de réseaux de neurones convolutifs, cela signifie généralement les rendre disponibles pour traiter des images et des vidéos en temps réel.

Une fois déployés, ces modèles traitent de nouvelles données, qui passent généralement par des étapes de prétraitement comme le redimensionnement, la normalisation ou le formatage. Les données traitées sont ensuite transmises au modèle, qui applique les modèles appris lors de l'entraînement pour générer des prédictions de haute précision.

Selon le cas d'utilisation, cela peut inclure différentes tâches de vision par ordinateur. Par exemple, les modèles Ultralytics YOLO, comme Ultralytics YOLO26, prennent en charge un large éventail de tâches de vision, notamment la détection d'objets, la classification d'images, la segmentation d'instances, l'estimation de pose et la détection de boîtes englobantes orientées (OBB).

Pour rendre cela pratique dans des applications réelles, les modèles doivent souvent être intégrés dans des systèmes capables de gérer efficacement à la fois le prétraitement et l'inférence. C'est là que l'infrastructure de déploiement devient essentielle.

Dans les environnements de production, les modèles sont généralement accessibles via des API REST ou des systèmes de mise en service de modèles. Ces interfaces permettent aux applications d'envoyer des données et de recevoir des prédictions de manière programmatique, facilitant ainsi l'intégration avec des applications externes, des appareils IoT ou des systèmes robotiques qui reposent sur une compréhension visuelle en temps réel.

Link to this sectionLimites des outils traditionnels de déploiement de vision par ordinateur#

Le déploiement de modèles de vision par ordinateur peut sembler simple, mais jusqu'à présent, il était très différent dans la pratique. Prenons une configuration courante : les données sont d'abord capturées par des caméras ou des capteurs, envoyées à un modèle pour inférence, puis renvoyées à une application sous forme de prédictions.

En réalité, chacune de ces étapes est souvent gérée par des outils et services distincts. Un système peut gérer la capture de données, un autre gère la mise en service du modèle, tandis que des outils supplémentaires sont utilisés pour la mise à l'échelle, la surveillance et la journalisation. Garder ces composants connectés et fonctionnels de manière fiable peut rapidement devenir complexe.

À mesure que l'utilisation augmente, cette complexité s'accroît. Gérer l'infrastructure, traiter les dépendances et maintenir des performances cohérentes sur l'ensemble du pipeline peut ralentir le développement et rendre plus difficile le déploiement de modèles de vision par ordinateur dans des applications réelles.

La plateforme Ultralytics réunit ces composants dans un environnement unique et unifié. Cela offre un moyen plus cohérent de gérer l'ensemble du flux de travail de déploiement tout en prenant en charge les performances et la fiabilité à grande échelle.

Link to this sectionOptions de déploiement de modèle activées par la plateforme Ultralytics#

En plus d'unifier le processus de déploiement de modèle, la plateforme Ultralytics apporte également de la flexibilité à la façon dont les modèles sont déployés et utilisés.

Pour prendre en charge les différentes étapes du déploiement de modèles de vision par ordinateur, la plateforme propose quatre options : des tests basés sur le navigateur avec une inférence instantanée, une inférence partagée via des API pour le développement, des terminaux dédiés pour des déploiements de production évolutifs dans des régions mondiales, et l'exportation de modèles pour les faire fonctionner sur une infrastructure externe ou des appareils périphériques.

Examinons donc de plus près comment fonctionne chacune de ces options.

Link to this sectionValide tes modèles rapidement en utilisant l'onglet Predict#

Avant de passer un modèle en production, il est important de comprendre comment il se comporte sur de nouvelles données inédites. La plateforme Ultralytics inclut un onglet Predict intégré qui te permet d'exécuter une inférence directement dans le navigateur sans aucune configuration, infrastructure ou dépendance.

L'onglet Predict rend la validation de modèle rapide et interactive. Tu peux télécharger des images, utiliser des exemples préchargés ou capturer des entrées avec une webcam, et l'inférence s'exécute automatiquement dès que les données sont fournies.

Les résultats apparaissent instantanément avec des superpositions visuelles, des scores de confiance et des sorties détaillées, te donnant une vision claire de la façon dont le modèle se comporte.

Validation d'un modèle via l'onglet Predict

Fig 2. Un exemple de validation d'un modèle en utilisant l'onglet Predict (Source)

Cela signifie qu'en quelques clics, tu peux tester différentes entrées, ajuster des paramètres et évaluer les performances au sein d'une interface unique avant de passer au déploiement.

Link to this sectionExécution d'inférences partagées pour les tests ou une utilisation légère#

Disons que tu as entraîné un modèle et que tu l'as validé en utilisant l'onglet Predict. L'étape suivante consiste souvent à commencer à intégrer ce modèle dans une application ou un flux de travail.

Au lieu de mettre en place une infrastructure ou de gérer des serveurs, la plateforme Ultralytics fournit des services d'inférence partagés qui te permettent d'envoyer des données à ton modèle et de recevoir des prédictions via de simples API REST.

En coulisses, l'inférence partagée s'exécute sur un système multi-locataire dans quelques régions clés, où les requêtes sont automatiquement acheminées vers le service disponible le plus proche. Cela aide à maintenir des performances réactives tout en permettant aux utilisateurs situés dans différents endroits d'accéder aux modèles de manière cohérente.

Tu peux envoyer des entrées en utilisant des requêtes HTTP standard et recevoir des sorties structurées en retour, ce qui rend simple la connexion des modèles à des applications, des scripts ou des flux de travail d'automatisation. Cette configuration est une excellente option pour le développement, les tests, les intégrations ou une utilisation plus légère avant de passer à des déploiements de production plus évolutifs.

Link to this sectionDéploie tes modèles mondialement via des terminaux dédiés#

Une fois qu'un modèle est prêt pour la production, il doit gérer le trafic réel de manière fiable et à grande échelle. La plateforme Ultralytics prend en charge cela avec des terminaux dédiés, où les modèles fonctionnent comme des services à locataire unique à travers 43 régions mondiales. Déployer plus près des utilisateurs finaux aide à réduire la latence et à maintenir des performances cohérentes dans différents endroits.

Chaque terminal fonctionne avec ses propres ressources informatiques allouées et une URL unique pour les requêtes d'inférence. Ce niveau de contrôle facilite le réglage des déploiements en fonction des besoins de performance, des cas d'utilisation légers aux applications plus exigeantes à haut débit qui nécessitent davantage de ressources informatiques.

Déploiement de modèles à travers les régions mondiales via Ultralytics Platform

Fig 3. Tu peux déployer des modèles à travers 43 régions mondiales en utilisant la plateforme Ultralytics (Source)

Cependant, les terminaux dédiés sont conçus pour gérer eux-mêmes l'évolution des charges de travail, avec une mise à l'échelle automatique qui ajuste les ressources en fonction du trafic entrant. Ils augmentent leur capacité pendant les périodes de forte demande et la réduisent lorsque l'utilisation diminue. Avec la mise à l'échelle à zéro activée par défaut, les terminaux inactifs s'arrêtent automatiquement et redémarrent lorsque de nouvelles requêtes arrivent, aidant à optimiser l'utilisation des ressources sans intervention manuelle.

Link to this sectionExporte ton modèle facilement avec la plateforme Ultralytics#

De nos jours, l'IA en périphérie devient de plus en plus essentielle à mesure que davantage d'applications reposent sur l'exécution de modèles directement sur des appareils tels que des smartphones, des caméras et des systèmes embarqués. Exécuter des modèles localement peut également aider à répondre aux exigences de confidentialité des données, car les données sensibles telles que les images ou les flux vidéo peuvent être traitées directement sur l'appareil sans être envoyées à des serveurs externes.

Dans ces scénarios, les modèles doivent s'exécuter en dehors de la plateforme Ultralytics, ce qui fait de l'exportation de modèle une partie cruciale du processus de déploiement. Les modèles Ultralytics YOLO sont souvent entraînés en utilisant Python et PyTorch, et peuvent ensuite être exportés vers plus de 17 formats différents, dont ONNX, TensorRT, CoreML et OpenVINO.

Cette large gamme de formats garantit la compatibilité avec divers matériels, des unités de traitement graphique (GPU) haute performance aux appareils mobiles et embarqués. En plus de cela, l'exportation permet l'optimisation des performances pour des environnements spécifiques.

Selon le format, les modèles peuvent atteindre des vitesses d'inférence plus rapides, comme une performance GPU améliorée avec TensorRT ou une exécution CPU optimisée avec ONNX et OpenVINO. Des options comme la quantification FP16 et INT8 peuvent réduire davantage la taille du modèle et améliorer le débit, ce qui est particulièrement utile pour les déploiements en périphérie.

Sur la plateforme Ultralytics, l'exportation est intégrée directement dans le flux de travail, ce qui permet de générer rapidement des modèles optimisés en quelques clics. Les équipes peuvent passer de l'entraînement à l'exécution de modèles sur des systèmes externes sans ajouter de surcharge supplémentaire.

Une sélection de formats d'exportation sur Ultralytics Platform

Fig 4. Une sélection de formats d'exportation sur la plateforme Ultralytics.

Link to this sectionChoisir la bonne option de déploiement de modèle#

Chaque option de déploiement sur la plateforme Ultralytics prend en charge une étape différente du flux de travail, des premiers tests à l'utilisation en production. Voici un aperçu du moment où tu pourrais utiliser chacune d'entre elles :

Onglet Predict : Il est généralement utilisé juste après l'entraînement ou le réglage fin, lorsque tu veux valider la façon dont un modèle se comporte sur de nouvelles données en utilisant l'inférence basée sur le navigateur.
Inférence partagée : À ce stade, les modèles peuvent être intégrés dans des applications via des API, ce qui permet de tester des interactions réelles pendant le développement.
Terminaux dédiés : Ils sont utilisés pour les déploiements en production, où les modèles ont besoin de performances constantes, de ressources dédiées et de la capacité à évoluer à travers des régions mondiales.
Exportation de modèle : Lorsque les modèles doivent fonctionner en dehors de la plateforme, l'option de les exporter permet un déploiement sur des appareils périphériques, des applications mobiles ou une infrastructure personnalisée.

Les équipes passent souvent par ces options étape par étape, allant de la validation à l'intégration, puis finalement au déploiement en production, le tout au sein de la plateforme.

Link to this sectionSurveillance des modèles déployés via la plateforme Ultralytics#

Aussi critique que soit le déploiement, le pipeline de vision ne s'arrête pas là. Une fois qu'un modèle fonctionne en production, une surveillance continue est essentielle pour s'assurer qu'il fonctionne de manière fiable au fil du temps.

La plateforme Ultralytics fournit des outils de surveillance intégrés qui donnent aux équipes une visibilité claire sur le comportement de leurs modèles d'IA visuelle au fil du temps, prenant en charge un flux de travail d'opérations d'apprentissage automatique (MLOps) plus structuré.

La page Deploy comprend un tableau de bord qui suit les métriques clés telles que le nombre total de requêtes, les déploiements actifs, la latence de réponse et les taux d'erreur. Ces informations aident les équipes à comprendre les modèles d'utilisation, à évaluer la réactivité du système et à assurer des performances à faible latence à travers différentes charges de travail.

Surveillance des modèles déployés sur la plateforme Ultralytics

Fig 5. La plateforme Ultralytics facilite la surveillance des modèles déployés. (Source)

Chaque terminal dédié fournit également une observabilité détaillée via des vues de déploiement individuelles. Cela inclut l'accès aux journaux, à l'état de santé du modèle et aux données de performance en temps réel. Les journaux peuvent être utilisés pour déboguer des problèmes, tracer les requêtes ayant échoué et identifier des problèmes potentiels liés aux dépendances ou à l'infrastructure.

À mesure que les environnements de production évoluent, des facteurs tels que l'évolution des données d'entrée, les exigences de mise à l'échelle ou les changements dans les modèles d'utilisation peuvent impacter la précision et la robustesse du modèle. En surveillant continuellement les métriques de performance, les équipes peuvent détecter les anomalies, identifier les goulots d'étranglement et prendre des mesures correctives telles que l'optimisation du modèle ou des ajustements de ressources pour maintenir une mise en service de modèle cohérente et fiable.

Link to this sectionIntégrer la scalabilité dans les déploiements de modèles de vision par ordinateur#

Faire évoluer les systèmes de vision par ordinateur a traditionnellement signifié assembler des flux de travail et des frameworks qui n'ont jamais été conçus pour fonctionner ensemble. Les pipelines de données, les boucles d'entraînement, l'infrastructure de déploiement et les systèmes de surveillance vivent souvent dans des endroits séparés, créant des frictions à chaque étape.

Le vrai défi n'est pas seulement de construire des modèles, mais de les garder en mouvement. Passer des données à la production, s'adapter à de nouvelles entrées, gérer une demande croissante et s'améliorer continuellement sans ralentir.

Ce qui ressort de la plateforme Ultralytics, c'est que ce mouvement est intégré. Au lieu de traiter chaque étape comme une étape séparée, elle les connecte dans une boucle continue où les modèles peuvent être développés, déployés, observés et mis à jour dans le même environnement.

Ce changement modifie la façon dont les équipes évoluent. Il ne s'agit plus de l'orchestration d'outils ou d'infrastructure, mais de maintenir l'élan à mesure que les systèmes grandissent.

Link to this sectionPoints clés#

Amener des modèles d'apprentissage automatique comme des modèles de vision par ordinateur dans des applications réelles nécessite qu'ils soient fiables, évolutifs et faciles à gérer. La plateforme Ultralytics simplifie ce processus en combinant diverses fonctions, telles que la mise en service, le déploiement et la surveillance de modèles, dans un environnement unifié. Avec des options de déploiement flexibles et des outils intégrés, les équipes peuvent passer de l'expérimentation à la production plus rapidement et avec moins de complexité.

Jette un œil à notre communauté et explore notre dépôt GitHub pour en savoir plus. Explore nos pages de solutions pour voir diverses applications comme l'IA dans la santé et la vision par ordinateur dans la logistique. Découvre nos options de licence et commence à construire dès aujourd'hui !

Explore solutions

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique

Demander une licence Commencer

Comment la plateforme Ultralytics simplifie le déploiement de modèles de vision par ordinateur

Link to this sectionUn aperçu du déploiement de modèles de vision par ordinateur#

Link to this sectionLimites des outils traditionnels de déploiement de vision par ordinateur#

Link to this sectionOptions de déploiement de modèle activées par la plateforme Ultralytics#

Link to this sectionValide tes modèles rapidement en utilisant l'onglet Predict#

Link to this sectionExécution d'inférences partagées pour les tests ou une utilisation légère#

Link to this sectionDéploie tes modèles mondialement via des terminaux dédiés#

Link to this sectionExporte ton modèle facilement avec la plateforme Ultralytics#

Link to this sectionChoisir la bonne option de déploiement de modèle#

Link to this sectionSurveillance des modèles déployés via la plateforme Ultralytics#

Link to this sectionIntégrer la scalabilité dans les déploiements de modèles de vision par ordinateur#

Link to this sectionPoints clés#

Explore solutions

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

Construisons ensemble le futur de l'IA !