Plateforme Ultralytics

Ultralytics Platform : Déployer des modèles de vision par ordinateur dans n'importe quelle région

Apprends à déployer tes modèles de vision par ordinateur dans n'importe quelle région à l'aide de la Ultralytics Platform pour un déploiement IA évolutif, rapide et flexible.

ABAbirami Vina6 min readMarch 20, 2026

Déployer des modèles de vision par ordinateur dans n'importe quelle région avec la Ultralytics Platform

Plus tôt cette semaine, Ultralytics a lancé Ultralytics Platform, un nouvel environnement de bout en bout conçu pour accélérer la livraison des systèmes de vision par ordinateur (CV) en rationalisant chaque étape du flux de travail de vision par IA, de la préparation des données et du développement de modèles jusqu'au déploiement.

L'une des motivations clés derrière le développement de la plateforme Ultralytics est que transformer une solution de vision par ordinateur, qui permet aux machines d'analyser des images et des vidéos, en un impact concret nécessite plus que la simple construction d'un modèle robuste. Une fois qu'un modèle a été entraîné et validé, il doit être déployé pour que les applications puissent envoyer des images, recevoir des prédictions et exécuter des inférences de manière fiable dans des environnements réels.

Cette étape du cycle de vie de l'apprentissage automatique est celle où les modèles de vision par ordinateur dépassent le stade de l'expérimentation pour commencer à alimenter des systèmes pratiques. Même si les étapes précédentes comme la préparation des jeux de données, l'annotation, l'entraînement du modèle et les tests se déroulent sans encombre, sans un moyen fiable de déployer les modèles, ces résultats ne peuvent pas faire la différence.

La réalité dans de nombreux projets de vision par ordinateur est que le déploiement peut être l'une des étapes les plus complexes du flux de travail.

Les équipes doivent souvent configurer des API d'inférence, gérer les ressources de calcul, déployer des modèles au plus près des utilisateurs pour réduire la latence, et surveiller les performances une fois que les systèmes sont en production.

La plateforme Ultralytics rationalise et automatise ce processus en offrant de multiples options de déploiement, notamment des formats d'exportation de modèles, des services d'inférence partagés et des points de terminaison dédiés dans des régions du monde entier. Grâce à une infrastructure gérée et une surveillance intégrée, les équipes peuvent facilement passer de modèles entraînés à des systèmes de vision par ordinateur prêts pour la production.

Aperçu du déploiement de modèles à l'aide d'Ultralytics Platform

Fig 1. Aperçu du déploiement de modèles à l'aide d'Ultralytics Platform (Source)

Dans cet article, nous allons explorer comment déployer des modèles de vision par ordinateur vers n'importe quelle région en utilisant des points de terminaison dédiés sur la plateforme Ultralytics. Commençons !

Qu'est-ce que le déploiement de modèle de CV ?#

Avant de plonger dans la manière de déployer des modèles d'apprentissage profond en utilisant la plateforme Ultralytics, comprenons mieux ce que signifie réellement le déploiement de modèle de vision par ordinateur.

Le déploiement de modèles de vision par ordinateur est le processus qui consiste à prendre un modèle entraîné et à le rendre disponible pour une utilisation concrète. Au lieu de s'exécuter uniquement dans un environnement d'entraînement, le modèle est configuré de sorte que les applications puissent lui envoyer des images ou des vidéos et recevoir des prédictions en retour.

Par exemple, un modèle pourrait détecter des objets dans une image, effectuer une segmentation d'image, identifier des articles dans un entrepôt ou reconnaître des motifs dans des séquences vidéo. Dans la plupart des systèmes réels, cela se produit via une API ou un point de terminaison d'inférence.

Une application envoie une image au modèle, celui-ci la traite et renvoie une prédiction en quelques millisecondes. C'est ce qui permet aux modèles de vision par ordinateur tels que Ultralytics YOLO d'alimenter des applications en temps réel.

Les modèles peuvent être déployés dans différents environnements selon le cas d'utilisation. Certains fonctionnent dans le cloud (via des plateformes cloud) et de nombreuses applications peuvent y accéder, tandis que d'autres s'exécutent sur des appareils en périphérie (edge devices), comme des caméras sur site, des robots ou des systèmes embarqués qui nécessitent des prédictions locales rapides.

Options de déploiement de modèles d'IA sur la plateforme Ultralytics#

Bien que la plateforme Ultralytics réponde à de nombreux défis rencontrés par la communauté de la vision par ordinateur, en particulier en ce qui concerne le déploiement de modèles, elle offre des moyens flexibles d'exécuter des inférences en fonction des besoins de ton application.

Voici un aperçu rapide des options de déploiement de modèles disponibles sur la plateforme :

Exportation de modèles : tu peux exporter des modèles vers 17 formats différents, notamment ONNX, TensorRT, CoreML et TFLite, ce qui permet d'exécuter des modèles dans un large éventail d'environnements, tels que des appareils de périphérie (edge devices) comme Raspberry Pi et NVIDIA Jetson, des applications mobiles, des conteneurs Docker et une infrastructure personnalisée.
Inférence partagée : La plateforme te permet d'exécuter des prédictions via un service d'inférence partagé géré, ce qui est idéal pour tester rapidement des modèles.
Points de terminaison dédiés : déploie facilement des modèles en tant que services indépendants dotés d'URL d'API uniques capables de s'exécuter dans 43 régions mondiales, avec des fonctionnalités intégrées de mise à l'échelle automatique, de surveillance et de vérification de l'état pour les déploiements en production.

Déploiement en utilisant des points de terminaison dédiés#

L'un des moyens les plus évolutifs d'exécuter des modèles pré-entraînés ou des modèles de vision par ordinateur personnalisés en production sur la plateforme Ultralytics consiste à utiliser des points de terminaison dédiés. Un point de terminaison dédié te permet de déployer un modèle entraîné en tant que service propre, afin que les applications puissent lui envoyer des images et recevoir des prédictions via une API.

Au lieu d'exécuter un modèle uniquement dans un environnement d'entraînement ou un notebook local, le déployer en tant que point de terminaison le rend accessible à de vraies applications. Par exemple, un système d'entrepôt pourrait envoyer des images de colis pour la détection d'objets, une caméra intelligente pourrait analyser des images vidéo, ou un système robotique pourrait utiliser des prédictions pour guider des actions.

Chaque point de terminaison dédié fonctionne comme un service à locataire unique (single-tenant), ce qui signifie que l'infrastructure exécutant ton modèle n'est pas partagée avec d'autres utilisateurs. Cela offre des performances plus prévisibles et facilite la surveillance du comportement du modèle en production.

Comprendre la fonctionnalité des points de terminaison d'inférence dédiés#

Tu peux concevoir un point de terminaison dédié comme un service hébergé pour ton modèle. La plateforme Ultralytics fournit une URL de point de terminaison unique qui sert de point d'entrée pour les applications.

Lorsqu'une application envoie une requête à cette URL, elle inclut une image et des paramètres optionnels tels que des seuils de confiance ou la taille de l'image, ainsi qu'une clé API pour l'authentification.

Le service exécute l'inférence sur l'image en utilisant ton modèle et renvoie les prédictions dans une réponse structurée. Cette configuration permet aux développeurs d'intégrer des modèles de vision par ordinateur dans des systèmes réels en utilisant des outils web standard.

Les applications peuvent envoyer des requêtes en utilisant Python, JavaScript, cURL ou d'autres clients HTTP, ce qui facilite la connexion des modèles à des tableaux de bord, des systèmes robotiques ou des applications cloud. Comme le point de terminaison fonctionne indépendamment, il peut également prendre en charge la mise à l'échelle, la surveillance et le déploiement mondial, aidant les équipes à construire des systèmes de vision par ordinateur de production fiables.

Le déploiement multi-région améliore l'inférence en temps réel#

Un avantage clé des points de terminaison dédiés sur la plateforme Ultralytics est la possibilité de déployer des modèles dans 43 régions mondiales. Ces régions couvrent plusieurs parties du monde, notamment l'Amérique du Nord, l'Amérique du Sud, l'Europe, l'Asie-Pacifique, ainsi que le Moyen-Orient et l'Afrique.

Ultralytics Platform prenant en charge 43 régions mondiales

Fig 2. Ultralytics Platform prend en charge 43 régions mondiales (Source)

Déployer des modèles dans des régions proches de l'endroit où les applications s'exécutent permet de réduire la latence, qui est le temps nécessaire pour qu'une application envoie une image et reçoive une prédiction. Cela peut également aider les organisations à respecter les exigences en matière de confidentialité et de résidence des données en gardant le traitement des données plus proche de leur origine.

Une faible latence est importante pour de nombreuses applications de vision par ordinateur qui dépendent de l'inférence en temps réel, telles que les systèmes robotiques, les appareils de l'Internet des objets (IoT), les pipelines d'inspection industrielle et les infrastructures de villes intelligentes.

Par exemple, si une application est utilisée principalement en Europe, le déploiement du modèle dans une région européenne peut améliorer considérablement les temps de réponse par rapport à l'exécution du modèle dans une région distante.

Comment déployer vers n'importe quelle région avec la plateforme Ultralytics#

Déployer un modèle vers une région spécifique est simple et ne prend généralement que quelques minutes. La plateforme gère la configuration de l'infrastructure afin que les développeurs puissent se concentrer sur l'intégration du modèle dans leurs applications. Passons en revue les étapes impliquées.

Étape 1 : Entraîner ou télécharger un modèle#

Avant de déployer, tu as besoin d'un modèle entraîné disponible dans ton projet. Il peut s'agir d'un modèle entraîné directement sur la plateforme Ultralytics, d'un modèle téléchargé après avoir été entraîné ailleurs, ou d'un modèle cloné à partir d'un projet communautaire trouvé dans l'« onglet Explorer », où les projets publics partagés par d'autres utilisateurs peuvent être copiés sur ton propre compte en un seul clic.

Une fois que le modèle est prêt, ouvre sa page de modèle dans ton projet pour continuer.

Étape 2 : Ouvrir l'onglet Déployer#

Navigue vers l'onglet Déployer du modèle. Cette section de la plateforme te permet de configurer et de lancer des déploiements.

Sur cette page, tu verras un tableau des régions et une carte interactive affichant les emplacements de déploiement disponibles dans le monde entier. La plateforme mesure la latence depuis ton emplacement et trie les régions en conséquence pour t'aider à choisir la région la plus adaptée.

Régions triées par latence sur Ultralytics Platform

Fig 3. Régions triées par latence sur Ultralytics Platform (Source)

Étape 3 : Choisir une région de déploiement#

Sélectionne une région en fonction de l'endroit où se trouvent tes utilisateurs ou tes applications. Déployer le modèle plus près de la source des requêtes peut réduire considérablement les temps de réponse.

Étape 4 : Déployer le point de terminaison#

Après avoir sélectionné la région et confirmé la configuration, tu peux cliquer sur Déployer.

La plateforme prépare ensuite l'environnement de déploiement, extrait l'image du modèle, démarre le service et effectue un contrôle d'état pour s'assurer que le point de terminaison est prêt. Ce processus prend généralement environ une à deux minutes.

Une fois le déploiement terminé, la plateforme génère une URL de point de terminaison unique que les applications peuvent utiliser pour envoyer des requêtes d'inférence.

Exemple de point de terminaison déployé

Fig 4. Exemple de point de terminaison déployé (Source)

Étape 5 : Commencer à envoyer des requêtes d'inférence#

Avec le point de terminaison en cours d'exécution, les applications peuvent commencer à envoyer des images au modèle en utilisant le point de terminaison REST API fourni et une clé API transmise dans l'en-tête Authorization. Le point de terminaison traite chaque requête et renvoie des prédictions telles que des objets détectés, des boîtes englobantes ou d'autres sorties spécifiques à la tâche.

Pour plus de détails concernant le déploiement de modèles, consulte la documentation officielle d'Ultralytics Platform.

Surveiller les performances et les métriques des modèles pour les points de terminaison déployés#

Une fois qu'un modèle de vision par ordinateur est déployé, la surveillance de ses performances devient une partie importante du maintien de la fiabilité et de la robustesse du système. Même un modèle bien entraîné doit être observé en production pour garantir qu'il continue de répondre rapidement, de gérer correctement les requêtes entrantes et de fournir des prédictions précises.

Ultralytics Platform fournit des outils de surveillance intégrés qui permettent aux équipes de visualiser les performances des points de terminaison déployés. La page Deploy de la plateforme fait office de tableau de bord de surveillance, offrant une vue centralisée de tous les points de terminaison en cours d'exécution ainsi que des métriques clés qui aident à suivre l'état de santé et l'utilisation du système.

Voici quelques-unes des métriques que tu peux surveiller en utilisant la plateforme :

Latence P95 : Cette métrique mesure le temps de réponse côté serveur du 95e percentile pour les requêtes d'inférence. Elle donne un aperçu de la durée nécessaire à la plupart des requêtes d'inférence et identifie les ralentissements de performance.
Taux d'erreur : Il représente le pourcentage de requêtes ayant échoué ou retourné des erreurs au cours de la période de surveillance sélectionnée. La surveillance des taux d'erreur permet aux équipes de détecter rapidement les problèmes avec les déploiements ou les requêtes entrantes.
Nombre total de requêtes : Cette métrique affiche le nombre total de requêtes d'inférence traitées sur les points de terminaison déployés pendant la période sélectionnée (par exemple, les dernières 24 heures). Elle aide les équipes à comprendre les niveaux de trafic et la fréquence à laquelle leurs modèles sont utilisés.

En plus de ces métriques, la plateforme fournit également des contrôles d'état des points de terminaison et des journaux de déploiement. Les contrôles d'état indiquent si un point de terminaison répond correctement, tandis que les journaux fournissent des informations détaillées sur les requêtes récentes et l'activité du système.

Points clés#

Le déploiement de modèles de vision par ordinateur est une étape cruciale pour transformer des modèles entraînés en systèmes qui alimentent des applications réelles. Avec la plateforme Ultralytics, les équipes peuvent facilement déployer des modèles via des points de terminaison dédiés dans 43 régions mondiales, exécuter des inférences en temps réel via des API et surveiller les performances à partir d'un environnement unique. En combinant des options de déploiement flexibles, une surveillance intégrée et une infrastructure évolutive, la plateforme aide les développeurs à passer plus rapidement de modèles d'apprentissage automatique entraînés à des applications de vision par ordinateur fiables.

Rejoins notre communauté en pleine croissance ! Plonge dans notre dépôt GitHub pour en savoir plus sur l'IA. Si tu cherches à créer des solutions de vision par ordinateur, consulte nos options de licence. Explore les avantages de la vision par ordinateur dans la santé et découvre comment l'IA dans la logistique fait la différence !

Explore solutions

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

Ultralytics Platform : Déployer des modèles de vision par ordinateur dans n'importe quelle région

Qu'est-ce que le déploiement de modèle de CV ?#

Options de déploiement de modèles d'IA sur la plateforme Ultralytics#

Déploiement en utilisant des points de terminaison dédiés#

Comprendre la fonctionnalité des points de terminaison d'inférence dédiés#

Le déploiement multi-région améliore l'inférence en temps réel#

Comment déployer vers n'importe quelle région avec la plateforme Ultralytics#

Étape 1 : Entraîner ou télécharger un modèle#

Étape 2 : Ouvrir l'onglet Déployer#

Étape 3 : Choisir une région de déploiement#

Étape 4 : Déployer le point de terminaison#

Étape 5 : Commencer à envoyer des requêtes d'inférence#

Surveiller les performances et les métriques des modèles pour les points de terminaison déployés#

Points clés#

Explore solutions

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

Construisons ensemble le futur de l'IA !