Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Ultralytics : Déploiement de modèles de vision par ordinateur dans n'importe quelle région

Découvrez comment déployer vos modèles de vision par ordinateur dans n'importe quelle région grâce à Ultralytics , pour un déploiement de l'IA évolutif, rapide et flexible.

Développez vos projets de vision par ordinateur avec Ultralytics

Démarrer

Au début de la semaine, Ultralytics Ultralytics , un nouvel environnement de bout en bout conçu pour accélérer la mise sur le marché des systèmes de vision par ordinateur (CV) en rationalisant chaque étape du processus de travail de l'IA visuelle, depuis la préparation des données et le développement des modèles jusqu'au déploiement.

L'une des principales motivations qui ont présidé au développement Ultralytics est la conviction que la mise en œuvre d'une solution de vision par ordinateur permettant aux machines d'analyser des images et des vidéos, depuis la conception jusqu'à l'obtention de résultats concrets, ne se limite pas à la création d'un modèle performant. Une fois qu'un modèle a été entraîné et validé, il doit être déployé afin que les applications puissent envoyer des images, recevoir des prédictions et effectuer des inférences de manière fiable dans des environnements réels.

C'est à cette étape du cycle de vie de l'apprentissage automatique que les modèles de vision par ordinateur dépassent le stade expérimental et commencent à alimenter des systèmes concrets. Même si les étapes précédentes, telles que la préparation des ensembles de données, l'annotation, l'entraînement des modèles et les tests, se déroulent sans encombre, ces résultats ne peuvent avoir d'impact sans un moyen fiable de déployer les modèles.

Dans de nombreux projets de vision par ordinateur, le déploiement s'avère souvent être l'une des étapes les plus complexes du processus. 

Les équipes doivent souvent configurer des API d'inférence, gérer les ressources de calcul, déployer des modèles à proximité des utilisateurs afin de réduire la latence, et surveiller les performances une fois que les systèmes sont en production.

Ultralytics rationalise et automatise ce processus en proposant plusieurs options de déploiement, notamment des formats d'exportation de modèles, des services d'inférence partagés et des points de terminaison dédiés dans différentes régions du monde. Grâce à une infrastructure gérée et à des fonctionnalités de surveillance intégrées, les équipes peuvent facilement passer de modèles entraînés à des systèmes de vision par ordinateur prêts à être mis en production.

Fig. 1. Aperçu du déploiement de modèles à l'aide de Ultralytics (Source)

Dans cet article, nous allons voir comment déployer des modèles de vision par ordinateur dans n'importe quelle région à l'aide de points de terminaison dédiés sur Ultralytics . C'est parti !

Qu'est-ce que le déploiement d'un modèle de CV ?

Avant d'aborder le déploiement de modèles d'apprentissage profond à l'aide de Ultralytics , voyons d'abord ce que recouvre exactement le déploiement de modèles de vision par ordinateur.

Le déploiement d'un modèle de vision par ordinateur consiste à prendre un modèle entraîné et à le rendre opérationnel pour une utilisation en conditions réelles. Au lieu de fonctionner uniquement dans un environnement d'entraînement, le modèle est configuré de manière à ce que les applications puissent lui envoyer des images ou des vidéos et recevoir des prédictions en retour. 

Par exemple, un modèle peut detect dans une image, effectuer une segmentation d'image, identifier des articles dans un entrepôt ou reconnaître des motifs dans des séquences vidéo. Dans la plupart des systèmes réels, cela se fait via une API ou un point de terminaison d'inférence. 

Une application envoie une image au modèle, celui-ci la traite et renvoie une prédiction en quelques millisecondes. C'est ce qui permet aux modèles de vision par ordinateur tels que Ultralytics YOLO de prendre en charge des applications en temps réel.

Les modèles peuvent être déployés dans différents environnements en fonction du cas d'utilisation. Certains s'exécutent dans le cloud (via des plateformes cloud) et sont accessibles à de nombreuses applications, tandis que d'autres s'exécutent sur des périphériques en périphérie, tels que des caméras sur site, des robots ou des systèmes embarqués qui nécessitent des prédictions locales rapides.

Options de déploiement des modèles d'IA sur Ultralytics

Si Ultralytics répond à de nombreux défis auxquels est confrontée la communauté de la vision par ordinateur, notamment en matière de déploiement de modèles, elle offre également des méthodes flexibles pour exécuter des inférences en fonction des besoins de votre application. 

Voici un aperçu des options de déploiement de modèles disponibles sur la plateforme :

  • Exportation de modèles: Vous pouvez exporter des modèles vers 17 formats différents, notamment ONNX, TensorRT, CoreML et TFLite, ce qui permet d'exécuter des modèles dans un large éventail d'environnements, tels que des appareils périphériques comme le Raspberry Pi et NVIDIA , des applications mobiles, des conteneurs Docker et des infrastructures personnalisées.
  • Inférence partagée : la plateforme vous permet d'effectuer des prédictions via un service d'inférence partagée géré, ce qui est idéal pour tester rapidement des modèles 
  • Points de terminaison dédiés: Déployez facilement des modèles en tant que services indépendants dotés d'URL API uniques, pouvant fonctionner dans 43 régions du monde entier, avec des fonctionnalités intégrées d'auto-scaling, de surveillance et de vérification de l'état de santé pour les déploiements en production.

Déploiement à l'aide de points de terminaison dédiés

L'un des moyens les plus évolutifs d'exécuter des modèles pré-entraînés ou des modèles de vision par ordinateur personnalisés en production sur Ultralytics consiste à utiliser des points de terminaison dédiés. Un point de terminaison dédié vous permet de déployer un modèle entraîné en tant que service autonome, de sorte que les applications puissent lui envoyer des images et recevoir des prédictions via une API.

Au lieu d'exécuter un modèle uniquement dans un environnement d'entraînement ou un notebook local, son déploiement en tant que point de terminaison le rend accessible à des applications réelles. Par exemple, un système d'entrepôt pourrait envoyer des images de colis à des fins de détection d'objets, une caméra intelligente pourrait analyser des images vidéo, ou un système robotique pourrait utiliser des prédictions pour guider ses actions.

Chaque point de terminaison dédié fonctionne comme un service à locataire unique, ce qui signifie que l'infrastructure sur laquelle votre modèle est exécuté n'est pas partagée avec d'autres utilisateurs. Cela garantit des performances plus prévisibles et facilite la surveillance du comportement du modèle en production.

Comprendre le fonctionnement des points de terminaison dédiés à l'inférence

Vous pouvez considérer un point de terminaison dédié comme un service hébergé pour votre modèle. Ultralytics fournit une URL de point de terminaison unique qui sert de point d'entrée pour les applications. 

Lorsqu'une application envoie une requête à cette URL, elle inclut une image et des paramètres facultatifs, tels que les seuils de confiance ou la taille de l'image, ainsi qu'une clé API pour l'authentification.

Le service effectue une inférence sur l'image à l'aide de votre modèle et renvoie les prédictions sous la forme d'une réponse structurée. Cette configuration permet aux développeurs d'intégrer des modèles de vision par ordinateur dans des systèmes réels à l'aide d'outils web standard. 

Les applications peuvent envoyer des requêtes via Python, JavaScript, cURL ou d'autres clients HTTP, ce qui facilite la connexion des modèles à des tableaux de bord, des systèmes robotiques ou des applications cloud. Comme le point de terminaison fonctionne de manière autonome, il prend également en charge la mise à l'échelle, la surveillance et le déploiement à l'échelle mondiale, aidant ainsi les équipes à développer des systèmes de vision par ordinateur fiables en production.

Le déploiement multirégional améliore l'inférence en temps réel

L'un des principaux avantages des terminaux dédiés sur Ultralytics réside dans la possibilité de déployer des modèles dans 43 régions à travers le monde. Ces régions couvrent plusieurs parties du globe, notamment l'Amérique du Nord, l'Amérique du Sud, l'Europe, l'Asie-Pacifique, ainsi que le Moyen-Orient et l'Afrique.

Fig. 2. Ultralytics couvre 43 régions à travers le monde (Source)

Le déploiement de modèles dans des régions situées à proximité des lieux d'exécution des applications permet de réduire la latence, c'est-à-dire le temps nécessaire à une application pour envoyer une image et recevoir une prédiction. Cela peut également aider les entreprises à respecter les exigences en matière de confidentialité et de localisation des données, en effectuant le traitement des données à proximité de leur lieu d'origine. 

La faible latence est essentielle pour de nombreuses applications de vision par ordinateur qui reposent sur l'inférence en temps réel, telles que les systèmes robotiques, les appareils de l'Internet des objets (IoT), les chaînes d'inspection industrielle et les infrastructures des villes intelligentes.

Par exemple, si une application est principalement utilisée en Europe, le déploiement du modèle dans une région européenne peut améliorer considérablement les temps de réponse par rapport à son exécution dans une région éloignée. 

Comment déployer dans n'importe quelle région avec Ultralytics

Le déploiement d'un modèle dans une région spécifique est simple et ne prend généralement que quelques minutes. La plateforme se charge de la configuration de l'infrastructure, ce qui permet aux développeurs de se concentrer sur l'intégration du modèle dans leurs applications. Passons en revue les différentes étapes.

Étape 1 : Entraîner ou importer un modèle

Avant le déploiement, vous devez disposer d'un modèle entraîné dans votre projet. Il peut s'agir d'un modèle entraîné directement sur Ultralytics , d'un modèle importé après avoir été entraîné ailleurs, ou d'un modèle cloné à partir d'un projet communautaire disponible dans l'onglet « Explorer », où les projets publics partagés par d'autres utilisateurs peuvent être copiés sur votre propre compte en un seul clic.

Une fois le modèle prêt, ouvrez sa page de modèle dans votre projet pour continuer.

Étape 2 : Ouvrez l'onglet « Déploiement »

Accédez à l'onglet « Déploiement » du modèle. Cette section de la plateforme vous permet de configurer et de lancer des déploiements.

Sur cette page, vous trouverez un tableau des régions et une carte interactive indiquant les emplacements de déploiement disponibles à travers le monde. La plateforme mesure la latence depuis votre emplacement et classe les régions en conséquence afin de vous aider à choisir celle qui vous convient le mieux.

Fig. 3. Régions classées par temps de latence sur Ultralytics (Source)

Étape 3 : Choisissez une région de déploiement

Choisissez une région en fonction de la localisation de vos utilisateurs ou de vos applications. Le déploiement du modèle à proximité de la source des requêtes peut réduire considérablement les temps de réponse.

Étape 4 : Déployer le point de terminaison

Après avoir sélectionné la région et confirmé la configuration, vous pouvez cliquer sur « Déployer ».

La plateforme prépare ensuite l'environnement de déploiement, récupère l'image du modèle, démarre le service et effectue un contrôle de l'état de santé pour s'assurer que le point de terminaison est prêt. Ce processus prend généralement entre une et deux minutes.

Une fois le déploiement terminé, la plateforme génère une URL de point de terminaison unique que les applications peuvent utiliser pour envoyer des requêtes d'inférence.

Fig. 4. Exemple d'un terminal déployé (Source)

Étape 6 : Commencer à envoyer des requêtes d'inférence

Une fois le point de terminaison opérationnel, les applications peuvent commencer à envoyer des images au modèle via le REST API fourni et à l'aide d'une clé API transmise dans l'en-tête « Authorization ». Le point de terminaison traite chaque requête et renvoie des prédictions telles que les objets détectés, les cadres de sélection ou d'autres résultats spécifiques à la tâche.

Pour plus d'informations sur le déploiement des modèles, consultez la documentation officielle Ultralytics .

Suivi des performances et des indicateurs des terminaux déployés

Une fois qu'un modèle de vision par ordinateur est déployé, la surveillance de ses performances devient un élément essentiel pour garantir la fiabilité et la robustesse du système. Même un modèle bien entraîné doit faire l'objet d'une surveillance en production afin de s'assurer qu'il continue à répondre rapidement, à traiter correctement les requêtes entrantes et à fournir des prédictions précises.

Ultralytics intègre des outils de surveillance qui permettent aux équipes de suivre les performances des terminaux déployés. La page « Déploiement » de la plateforme fait office de tableau de bord de surveillance, offrant une vue centralisée de tous les terminaux en service ainsi que des indicateurs clés permettant de track l'état de santé et l'utilisation track .

Voici quelques-uns des indicateurs que vous pouvez suivre à l'aide de la plateforme :

  • Latence P95 : cet indicateur mesure le temps de réponse côté serveur au 95e centile pour les requêtes d'inférence. Il permet de déterminer la durée moyenne des requêtes d'inférence et d'identifier les ralentissements de performance.
  • Taux d'erreur : il correspond au pourcentage de requêtes qui ont échoué ou ont renvoyé des erreurs au cours de la période de surveillance sélectionnée. La surveillance des taux d'erreur permet aux équipes detect rapidement detect liés aux déploiements ou aux requêtes entrantes.
  • Nombre total de requêtes : cet indicateur indique le nombre total de requêtes d'inférence traitées sur l'ensemble des points de terminaison déployés au cours de la période sélectionnée (par exemple, les dernières 24 heures). Il aide les équipes à évaluer le volume de trafic et la fréquence d'utilisation de leurs modèles.

Outre ces indicateurs, la plateforme propose également des contrôles d'intégrité des terminaux et des journaux de déploiement. Les contrôles d'intégrité permettent de vérifier si un terminal répond correctement, tandis que les journaux fournissent des informations détaillées sur les requêtes récentes et l'activité du système.

Principaux points à retenir

Le déploiement de modèles de vision par ordinateur est une étape cruciale pour transformer des modèles entraînés en systèmes qui alimentent des applications concrètes. Grâce à Ultralytics , les équipes peuvent facilement déployer des modèles via des points de terminaison dédiés dans 43 régions du monde, effectuer des inférences en temps réel via des API et surveiller les performances depuis un environnement unique. En combinant des options de déploiement flexibles, une surveillance intégrée et une infrastructure évolutive, la plateforme aide les développeurs à passer plus rapidement de modèles d'apprentissage automatique entraînés à des applications de vision par ordinateur fiables.

Rejoignez notre communauté en pleine croissance ! Plongez dans notre dépôt GitHub pour en savoir plus sur l’IA. Si vous cherchez à créer des solutions de vision par ordinateur, consultez nos options de licence. Découvrez les avantages de la vision par ordinateur dans le secteur de la santé et voyez comment l’IA dans la logistique fait la différence !

Construisons ensemble l'avenir de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique