Apprenez à déployer des modèles d'apprentissage automatique dans des environnements cloud ou périphériques. Découvrez comment la Ultralytics rationalise l'exportation et la production pour YOLO26.
Le déploiement du modèle est la phase critique au cours de laquelle un modèle d'apprentissage automatique entraîné est intégré dans un environnement de production environnement de production afin de prendre des décisions pratiques ou de faire des prédictions basées sur de nouvelles données. Il représente la transition d'un cadre de recherche ou expérimental, souvent réalisé dans des ordinateurs portables isolés, vers une application en direct où le modèle interagit avec les utilisateurs et les systèmes du monde réel. Ce processus transforme un fichier statique de poids et d'architecture en un agent IA actif capable de générer de la valeur, comme l'identification d' objets dans un flux vidéo ou la recommandation de produits sur un site web.
Un déploiement efficace nécessite de relever des défis distincts de la formation des modèles, notamment la latence, l'évolutivité et la compatibilité matérielle . Les organisations utilisent souvent la Ultralytics pour rationaliser ce cycle de vie, en veillant à ce que les modèles formés dans le cloud puissent être déployés de manière transparente dans divers environnements, allant de serveurs puissants à des périphériques à ressources limitées.
Les stratégies de déploiement se répartissent généralement en deux catégories : le déploiement dans le cloud et le déploiement en périphérie. Le choix dépend fortement des exigences spécifiques en matière de vitesse, de confidentialité et de connectivité.
Avant qu'un modèle puisse être déployé, il est généralement optimisé afin de garantir son bon fonctionnement sur le matériel cible . Ce processus implique l'exportation du modèle, où le format d'entraînement (comme PyTorch) est converti en un format adapté au déploiement, tel que ONNX (Open Neural Network Exchange) ou OpenVINO.
Les techniques d'optimisation telles que la quantification réduisent la taille du modèle et son empreinte mémoire sans sacrifier de manière significative la précision. Pour garantir la cohérence entre les différents environnements informatiques, les développeurs utilisent souvent des outils de conteneurisation tels que Docker, qui regroupent le modèle avec toutes ses dépendances logicielles nécessaires.
Voici un exemple illustrant comment exporter un modèle YOLO26 au ONNX , une étape courante dans la préparation du déploiement :
from ultralytics import YOLO
# Load the YOLO26 nano model
model = YOLO("yolo26n.pt")
# Export the model to ONNX format for broad compatibility
# This creates a file suitable for various inference engines
path = model.export(format="onnx")
print(f"Model successfully exported to: {path}")
Le déploiement de modèles alimente des systèmes de vision par ordinateur largement utilisés dans divers secteurs.
Il est important de distinguer le déploiement de modèle des termes connexes dans le cycle de vie de l'apprentissage automatique :
Le déploiement n'est pas une fin en soi. Une fois mis en service, les modèles doivent faire l'objet d'une surveillance continue afin de detect tels que la dérive des données, lorsque les données réelles commencent à diverger des données d'entraînement. Des outils tels que Prometheus ou Grafana sont souvent intégrés pour track les indicateurs track , garantissant ainsi la fiabilité du système au fil du temps. En cas de baisse des performances, le modèle peut devoir être réentraîné et redéployé, bouclant ainsi le cycle des MLOps.