ultralytics
Transférez vos modèles entraînés du navigateur vers les points de terminaison de production en quelques clics, avec mise à l'échelle automatique, surveillance en temps réel et plus de 17 formats d'exportation.

43+
Régions de déploiement
17+
Formats d'exportation
plus de 2,7 milliards
Usages quotidiens





Les terminaux dédiés s'adaptent automatiquement aux pics de trafic et se mettent en veille lorsqu'ils ne sont pas utilisés.
Réglage par défaut sur zéro. Aucun coût lorsque votre point de terminaison ne reçoit pas de requêtes.
Aucune limite de débit. Les points de terminaison dédiés ne sont soumis à aucune limite de débit.
Ressources configurables. Choisissez le nombre de cœurs CPU 1 à 8) et la quantité de mémoire (1 à 32 Go) en fonction de votre charge de travail.
Ultralytics prend en charge les déploiements dans le cloud et en périphérie pour des performances de haut niveau. TousYOLO Ultralytics sont optimisés en natif pour fonctionner efficacement dans tous les environnements, offrant une grande précision, des performances fiables et une compatibilité optimale, même sur des appareils en périphérie disposant de ressources de calcul limitées.


Une visibilité complète en temps réel sur les performances de vos modèles. Une fois vos modèles mis en production, le tableau de bord des déploiements vous offre une vue d'ensemble centralisée de tous les points de terminaison en cours d'exécution, avec les indicateurs et les outils dont vous avez besoin pour optimiser vos infrastructures et garantir leur fiabilité.
Volume de requêtes. Nombre total de requêtes sur l'ensemble des points de terminaison au cours des dernières 24 heures.
Latence P95. Temps de réponse au 95e centile permettant track les performances dans des conditions d'utilisation track .
Taux d'erreur. Recevez des alertes lorsque les taux d'erreur dépassent 5 %, avec des journaux filtrés par niveau de gravité pour diagnostiquer rapidement les problèmes.
Contrôles de santé. Surveillance en temps réel des terminaux avec réessais automatiques. Affichage de la latence pour chaque contrôle.
Chaque point de terminaison déployé est accompagné d'exemples de code générés automatiquement en Python, JavaScript et cURL, dans lesquels votre URL de point de terminaison et votre clé API sont déjà renseignées. Il vous suffit de copier-coller ces exemples pour commencer à envoyer des requêtes d'inférence depuis n'importe quelle application.

1
Annoter
2
Train
3
Déployer
Oui. Chaque modèle peut être déployé simultanément dans plusieurs régions . Le nombre total de points de terminaison disponibles dépend de votre formule : 3 pour la version gratuite, 10 pour la version Pro et un nombre illimité pour la version Enterprise. Cela vous permet de servir des utilisateurs partout dans le monde grâce à des points de terminaison à faible latence dans chaque région.
Les points de terminaison dédiés sont facturés en fonction de CPU, de la mémoire et du volume de requêtes. La fonctionnalité « Scale-to-zero » étant activée par défaut, vous ne payez que pour le temps d'inférence actif ; il n'y a aucun coût lorsque votre point de terminaison ne reçoit pas de requêtes. L'inférence partagée est incluse dans votre forfait de plateforme.
Les exécutions d'inférence partagées s'effectuent sur un service multi-locataires couvrant 3 régions et sont limitées à 20 requêtes par minute. Elles conviennent particulièrement au développement et aux tests rapides. Les points de terminaison dédiés sont des services mono-locataires déployés dans l'une des 43 régions disponibles, sans limite de débit, avec une latence constante et des ressources configurables, conçus pour les charges de travail de production évolutives.
Le déploiement d'un point de terminaison dédié prend généralement une à deux minutes. Cela comprend la mise à disposition du conteneur, son démarrage et un premier contrôle de l'état de santé visant à vérifier que le service est opérationnel. Une fois que le point de terminaison est prêt, il commence immédiatement à accepter les requêtes d'inférence .
Le déploiement d'un modèle consiste à rendre un modèle de vision par ordinateur entraîné opérationnel afin qu'il puisse recevoir et traiter des données du monde réel. Une fois déployées, les applications de vision par ordinateur peuvent envoyer des images et des images vidéo au modèle via une API et recevoir des prédictions, ce qui permet de réaliser toutes sortes de tâches, allant du contrôle qualité automatisé à la détection d'objets en temps réel dans les systèmes de production. Sur Ultralytics , le déploiement est directement intégré au flux de travail d'entraînement de bout en bout. Une fois votre modèle entraîné, vous pouvez le tester dans le navigateur, le déployer sur un point de terminaison dédié dans l'une des 43 régions mondiales et surveiller ses performances, le tout depuis le même espace de travail.
Déployez vos modèles entraînés dans 43 régions du monde grâce à la mise à l'échelle automatique et à la surveillance en temps réel.