En cliquant sur « Accepter tous les cookies », vous acceptez le stockage de cookies sur votre appareil pour améliorer la navigation sur le site, analyser son utilisation et contribuer à nos efforts de marketing. Plus d’infos
Paramètres des cookies
En cliquant sur « Accepter tous les cookies », vous acceptez le stockage de cookies sur votre appareil pour améliorer la navigation sur le site, analyser son utilisation et contribuer à nos efforts de marketing. Plus d’infos
Découvrez comment choisir le GPU cloud le mieux adapté GPU l'entraînement de modèles de vision par ordinateur sur la Ultralytics , en fonction de critères tels que la taille de l'ensemble de données, la complexité du modèle et le coût.
Développez vos projets de vision par ordinateur avec Ultralytics
Le mois dernier, nous avons présenté Ultralytics , un environnement complet conçu pour rationaliser l'ensemble du processus de vision par ordinateur, de la gestion des ensembles de données à l'entraînement et au déploiement des modèles. Ultralytics rassemble tout ce qui est nécessaire pour créer et faire évoluer des modèles d'IA de vision au sein d'une expérience unique et unifiée.
L'entraînement des modèles constitue un élément clé de ce processus : c'est là que les réseaux neuronaux apprennent à reconnaître des schémas à partir des données afin de formuler des prédictions précises, et l'accès aux ressources de calcul appropriées joue un rôle crucial. Nous avons précédemment examiné comment Ultralytics prend en charge l'entraînement des modèles à l'aide de processeurs graphiques (GPU) dans le cloud, permettant ainsi aux utilisateurs d'entraîner des modèles de vision par ordinateur sans avoir à gérer d'infrastructure locale.
Grâce à un accès à la demande à NVIDIA puissants NVIDIA , tous les utilisateurs, qu'il s'agisse d'étudiants, de start-ups, de chercheurs ou de grandes entreprises, peuvent exécuter leurs tâches d'IA plus efficacement que jamais. Si se lancer dans l'entraînement sur le cloud est simple, le choix du GPU approprié GPU prendre en compte des facteurs tels que la taille des ensembles de données, la complexité des modèles et le coût.
Compte tenu de la vaste gamme d'options disponibles aujourd'hui, allant des GPU RTX économiques aux NVIDIA hautes performances et au matériel Blackwell de nouvelle génération, le choix de la configuration adéquate peut avoir un impact significatif tant sur le développement des modèles que sur les coûts.
Dans cet article, nous allons nous intéresser à GPU dans le cloud pour la vision par ordinateur sur la Ultralytics , ainsi qu'à la manière de choisir le matériel adapté à votre charge de travail. C'est parti !
Présentation de la formation au cloud sur Ultralytics
Avant d'aborder la manière de choisir un GPU l'entraînement dans le cloud sur la Ultralytics , prenons un peu de recul pour voir comment fonctionne l'entraînement dans le cloud.
Qu'est-ce que GPU dans le cloud ?
GPU dans le cloud consiste à utiliser des GPU hébergés dans un environnement de cloud computing pour entraîner des modèles d'apprentissage automatique et d'apprentissage profond, plutôt que de recourir à votre propre matériel local ou à votre poste de travail. Sur Ultralytics , cela vous permet d'accéder à de puissants GPU à la demande et d'exécuter des tâches d'entraînement à distance, sans avoir besoin de votre propre infrastructure.
Cela vous permet d'adapter facilement vos ressources en fonction de votre charge de travail. Vous pouvez opter pour des GPU plus puissants ou augmenter la capacité selon vos besoins, sans être limité par les capacités de votre système. Vous pouvez voir cela comme si vous accédiez à des machines puissantes, ou des nœuds, situés dans des centres de données distants, où vous pouvez augmenter ou réduire vos ressources à votre guise.
Cela évite également d'avoir à installer et à entretenir du matériel coûteux. Vous n'avez pas besoin d'acheter des cartes graphiques, d'installer des pilotes ni de gérer des problèmes de compatibilité.
Ultralytics gère tout via des services cloud gérés, de l'allocation des ressources à la configuration de l'environnement, en passant par l'orchestration et l'exécution des tâches d'entraînement, afin que vous puissiez vous concentrer sur l'entraînement, l'expérimentation et l'amélioration de vos modèles.
Comment fonctionne l'entraînement des modèles sur la Ultralytics
Sur la Ultralytics , le processus d'entraînement GPU est très simple. Vous pouvez commencer par importer votre ensemble de données de plusieurs façons.
Vous pouvez importer vos propres données, utiliser les ensembles de données publics disponibles sur la plateforme ou cloner des ensembles de données partagés par la communauté afin de vous appuyer sur des travaux existants. Le clonage d'un ensemble de données crée une copie dans votre espace de travail, ce qui vous permet de le modifier et de l'enrichir tout en conservant l'original intact.
Une fois que vous avez sélectionné un ensemble de données, vous pouvez passer en revue et organiser vos images et vos annotations afin de vous assurer que tout est correctement structuré. La plateforme intègre également des outils d'annotation qui vous permettent d'étiqueter les données pour des tâches telles que la détection d'objets, la segmentation et la classification, ou d'accélérer le processus grâce à des fonctionnalités assistées par l'IA.
Fig. 1. Affichage d'un ensemble de données dans Ultralytics (Source)
Vous pouvez ensuite sélectionner ou créer un projet pour gérer vos sessions d'entraînement. Les projets vous permettent d'organiser et de comparer des modèles, track les indicateurs track et de regrouper les expériences associées en un seul endroit.
De là, vous pouvez passer à la formation sur le cloud, où vous choisissez un modèle, configurez les paramètres et sélectionnez un GPU de vos besoins en matière de performances et de budget. La plateforme se charge pour vous de l'infrastructure cloud sous-jacente.
Il provisionne GPU sélectionnée, prépare votre ensemble de données et exécute la tâche d'entraînement dans le cloud. Au fur et à mesure de l'entraînement, vous pouvez surveiller les indicateurs, les journaux et les performances du système en temps réel, sans avoir à gérer la configuration, CUDA , les frameworks tels que PyTorch TensorFlow, ni le matériel.
Principales fonctionnalités GPU sur GPU de Ultralytics
Voici quelques-unes des principales fonctionnalités de GPU dans le cloud sur la Ultralytics :
Formation en un clic : lancez des tâches de formation avec un minimum de configuration et passez rapidement de l'ensemble de données à la formation du modèle sans configuration complexe.
GPU à la demande : choisissez parmi une gamme GPU en fonction de vos besoins et adaptez vos ressources à la demande, sans engagement à long terme.
Surveillance en temps réel : suivez la progression de l'entraînement grâce à des graphiques et des journaux en direct, et consultez en temps réel les indicateurs système tels que GPU et la mémoire.
Points de sauvegarde automatiques : la progression de l'entraînement est enregistrée à intervalles réguliers, ce qui permet de reprendre ou de récupérer facilement son travail si nécessaire.
Déploiement simplifié: Une fois l'entraînement terminé, vous pouvez déployer vos modèles entraînés et les utiliser dans des applications ou des workflows via des API d'inférence partagées, des points de terminaison dédiés ou en les exportant pour les utiliser sur des systèmes externes. Ces options de déploiement permettent une inférence à faible latence, ce qui rend possible l'alimentation d'applications en temps réel telles que l'analyse vidéo, les systèmes d'automatisation et les solutions d'IA interactives.
Différentes GPU dans le cloud au sein de Ultralytics
Maintenant que nous avons vu comment fonctionne l'entraînement sur la plateforme, examinons les différentes GPU disponibles. Le GPU choisissez peut avoir une incidence sur la vitesse d'entraînement de votre modèle, ses performances et son coût.
Ultralytics propose une large gamme de cartes graphiques, allant des modèles d'entrée de gamme tels que la RTX 2000 Ada et la RTX A4500, en passant par des modèles comme la RTX 4000 Ada, la RTX A5000, la RTX 3090 et la RTX A6000, jusqu'aux modèles les plus puissants tels que la RTX 4090 et la RTX PRO 6000.
Fig. 2. Exemple des différentes GPU prises en charge par Ultralytics (Source)
Pour la plupart des utilisateurs, la RTX PRO 6000 constitue un choix par défaut équilibré. Elle offre des performances fiables pour une grande variété de tâches sans nécessiter beaucoup de réglages. La RTX 4090 est une autre option très prisée, qui offre d'excellentes performances pour son prix.
Pour les tâches moins exigeantes, comme les expériences rapides, le prototypage ou le traitement d'ensembles de données légers, les GPU tels que le RTX 2000 Ada et le RTX A4500 constituent un bon point de départ. À mesure que votre charge de travail augmente, des modèles comme le RTX 4000 Ada, le RTX A5000 et le RTX 3090 offrent des performances plus stables pour l'entraînement général.
Dans le haut de gamme, les GPU tels que l'A100 (Ampere), les H100 et H200 (Hopper) et le B200 (Blackwell) sont conçus pour les charges de travail à grande échelle. Ils sont particulièrement adaptés à l'entraînement de modèles très volumineux, au traitement d'ensembles de données massifs ou à l'exécution de tâches où la vitesse et les performances sont essentielles.
Comprendre GPU différents GPU et leurs applications
Voyons maintenant comment se comparent les différents types de GPU et à quels usages ils sont le mieux adaptés.
Les cartes graphiques RTX de NVIDIA généralement un meilleur rapport qualité-prix et sont couramment utilisées pour l'entraînement quotidien, l'expérimentation et les charges de travail de petite à moyenne envergure. Elles allient performances et accessibilité, ce qui les rend adaptées à un large éventail de cas d'utilisation.
En comparaison, les GPU tels que les modèles A100, A40 et L40 sont conçus pour des charges de travail plus lourdes et des entraînements à plus grande échelle. Ils offrent une stabilité et une évolutivité accrues, en particulier lors du traitement d'ensembles de données volumineux ou de modèles plus complexes.
Dans le haut de gamme, les GPU tels que le H100 et ceux basés sur l'architecture Blackwell NVIDIAconstituent le matériel d'IA le plus récent. Conçus pour les charges de travail hautement performantes, ils sont généralement utilisés pour l'entraînement à grande échelle, la recherche avancée ou les tâches urgentes.
La gamme GPU disponibles sur la Ultralytics offre une grande flexibilité pour différents types de charges de travail. En fonction de vos besoins, vous pouvez commencer par des configurations plus modestes et évoluer au fur et à mesure.
Comment choisir le GPU cloud adapté GPU votre projet
Lors du choix d'un GPU l'entraînement dans le cloud sur la Ultralytics , plusieurs facteurs doivent être pris en compte, notamment la taille de l'ensemble de données, la complexité du modèle et le coût. Passons en revue chacun de ces facteurs.
Adapter GPU à la taille de l'ensemble de données
L'un des principaux critères à prendre en compte lors du choix d'un GPU la taille de votre ensemble de données, car celle-ci influe sur la durée de l'entraînement et sur la puissance de calcul nécessaire.
Pour les petits ensembles de données, généralement composés de moins de 1 000 images, un GPU léger GPU le RTX 2000 suffit souvent. Cela convient parfaitement pour des expériences rapides et des sessions d'entraînement courtes.
Pour les ensembles de données de taille moyenne, comprenant environ 1 000 à 10 000 images, les cartes graphiques telles que la RTX 4090 ou la RTX A6000 offrent un meilleur équilibre entre performances et efficacité, ce qui vous permet de procéder à l'entraînement de manière plus fluide, sans longs délais.
Pour les ensembles de données plus volumineux, comprenant plus de 10 000 images, vous aurez probablement besoin d'un matériel plus puissant afin de maintenir des durées d'entraînement raisonnables. Les GPU tels que les GPU H100 sont mieux adaptés pour gérer des charges de travail plus lourdes et évoluer efficacement.
En résumé, il s'agit d'adapter la taille de votre ensemble de données à la puissance de calcul et aux capacités de traitement parallèle dont vous avez besoin.
Choisir un GPU de la taille et de la complexité du modèle
Un autre facteur important à prendre en compte lors du choix d'un GPU la taille et la complexité de votre modèle d'IA visuelle. Les modèles de tailles différentes nécessiteront des puissances de calcul variables.
Par exemple, les modèles plus petits nécessitent moins de puissance GPU et peuvent fonctionner efficacement sur des GPU tels que le RTX 2000 Ada, le RTX A4500 ou même le RTX 4090 si vous souhaitez obtenir des résultats plus rapides. Ils sont parfaits pour les expériences rapides, le prototypage et les tâches plus simples, vous permettant d'itérer plus rapidement et de tester des idées sans coûts de calcul élevés.
En revanche, les modèles plus volumineux et plus complexes nécessitent nettement plus de mémoire et de puissance de calcul. Les GPU tels que les RTX A6000, RTX PRO 6000 et les modèles haut de gamme comme le H100 sont mieux adaptés à ces charges de travail. Ils permettent de gérer des architectures plus volumineuses, de réduire le temps d'entraînement et d'éviter les problèmes de mémoire, ce qui est particulièrement important lorsqu'on travaille avec des images haute résolution, des lots volumineux ou des modèles plus sophistiqués.
Comparaison entre la taille des lots et GPU
De même, la taille du lot joue un rôle important dans l'entraînement du modèle. Elle désigne le nombre d'échantillons d'entraînement que le modèle traite en une seule fois, au cours d'une même étape.
Des lots plus volumineux peuvent améliorer l'efficacité de l'entraînement en traitant davantage de données à la fois, mais ils nécessitent également plus GPU (VRAM). En général, les GPU dotés d'une bande passante mémoire plus élevée peuvent prendre en charge des lots plus volumineux, tandis que ceux dont la mémoire est plus limitée peuvent nécessiter des lots plus petits.
Par exemple, les GPU tels que le RTX A6000, le RTX PRO 6000 ou l'A100 peuvent traiter plus facilement des lots plus volumineux grâce à leur mémoire plus importante, tandis que des modèles comme le RTX 4090 ou le RTX 2000 Ada peuvent nécessiter des lots plus petits en fonction de la charge de travail.
Cependant, GPU toujours nécessaire d'utiliser le GPU le plus puissant. Les GPU haut de gamme peuvent améliorer la vitesse et la capacité, mais leur coût est également plus élevé. Dans de nombreux cas, GPU s'avérer plus efficace d'ajuster la taille des lots sur un GPU moins puissant.
En fin de compte, l'objectif est de trouver le juste équilibre entre la taille des lots, GPU disponible et le coût, en fonction de votre modèle et de votre ensemble de données.
L'impact de la configuration d'entraînement sur GPU
Un autre facteur qui influe sur GPU est la configuration d'entraînement. Celle-ci comprend des paramètres tels que le nombre d'époques, la taille des images et d'autres réglages qui déterminent la manière dont un modèle est entraîné.
Par exemple, l'augmentation de la taille des images accroît la charge de calcul nécessaire à chaque étape. Cela peut ralentir l'apprentissage et nécessiter davantage de puissance de calcul ou de mémoire pour maintenir de bonnes performances.
De même, l'augmentation du nombre d'époques allonge la durée totale de l'entraînement, en particulier sur du matériel moins puissant. Une époque correspond à un passage complet sur l'ensemble des données pendant l'entraînement.
Des techniques telles que l'augmentation des données impliquent également un traitement supplémentaire pendant l'apprentissage. L'augmentation des données consiste à appliquer des transformations telles que la symétrie, la rotation ou la mise à l'échelle afin d'accroître la diversité des données et d'améliorer les performances du modèle. Si cela peut renforcer la robustesse du modèle, cela peut également ralentir la vitesse d'apprentissage.
En général, les cartes graphiques plus puissantes sont mieux à même de répondre efficacement à ces exigences accrues, mais l'impact dépendra de la configuration globale et de la charge de travail.
Trouver le juste équilibre entre le coût et le temps de formation
Lorsqu'on choisit un GPU son projet, il faut souvent trouver un compromis entre la vitesse d'entraînement et GPU .
Ultralytics permet d'estimer et de comprendre facilement ces coûts avant de lancer une session d'entraînement. En fonction de votre configuration, notamment la taille de l'ensemble de données, le modèle et GPU, vous pouvez connaître d'emblée le coût estimé et la durée de l'entraînement.
Fig. 3. Ultralytics permet d'estimer et de comprendre facilement les coûts liés au cloud. (Source)
Les GPU plus rapides ont généralement un coût horaire plus élevé, mais peuvent réduire la durée totale de l'entraînement. Les GPU tels que le RTX 4090, le RTX PRO 6000 et le H100 permettent généralement de mener à bien l'entraînement plus rapidement grâce à leurs performances supérieures.
Les GPU moins performants ont généralement un coût horaire moins élevé, mais leur temps d'entraînement est plus long. Par exemple, des GPU tels que le RTX 2000 Ada et le RTX A4500 sont souvent utilisés pour des charges de travail plus modestes ou des tâches de longue durée, où la réduction des coûts est une priorité.
De plus, certains des GPU les plus performants, comme le H200 et le B200, ne sont disponibles que dans les formules Pro ou Enterprise, tandis que la plupart des autres options sont également accessibles dans la formule gratuite.
Un aperçu des stratégies d'optimisation des coûts
Au-delà du choix du bon GPU, il existe plusieurs moyens concrets de maîtriser les coûts de formation. L'une des approches les plus efficaces consiste à commencer par de petits tests avant de passer à une plus grande échelle.
Au lieu de vous lancer directement dans un entraînement complet, commencez par un nombre réduit d'époques afin de vous assurer que votre configuration fonctionne comme prévu. Cela vous permettra de valider rapidement vos données, vos annotations et la configuration de votre modèle, et vous évitera de consacrer du temps et des ressources de calcul à des exécutions qui pourraient ne pas produire de résultats utiles.
Au fur et à mesure que l'entraînement progresse, surveillez vos indicateurs et interrompez vos séances dès que vos performances stagnent ou cessent de s'améliorer. Le suivi de vos courbes d'entraînement peut vous aider à déterminer s'il faut poursuivre ou adapter votre programme.
Vous pouvez également ajuster certains paramètres, tels que la taille des lots et la taille des images. Des valeurs plus faibles réduisent la consommation de mémoire et de ressources de calcul, ce qui facilite les expérimentations, les tests de différentes configurations ou l'exécution de simulations à petite échelle avant de passer à une échelle supérieure.
Fig. 4. Visualisation des indicateurs d'entraînement sur Ultralytics (Source)
De plus, Ultralytics facilite la gestion des coûts. Elle intègre une fonctionnalité d'estimation des coûts qui vous permet de connaître les dépenses prévues avant de commencer un projet.
Grâce à un système de paiement à l'utilisation basé sur des crédits, vous ne payez que pour le temps de calcul que vous utilisez réellement. Cela vous permet de respecter plus facilement votre budget et d'augmenter votre capacité de traitement une fois que vous êtes satisfait de votre configuration d'entraînement.
Bonnes pratiques en matière d'GPU dans le cloud pour la vision par ordinateur
Voici quelques bonnes pratiques à garder à l'esprit pour GPU dans le cloud via la Ultralytics :
Vérifiez vos ensembles de données avant l'entraînement : assurez-vous que votre ensemble de données est propre, correctement annoté et cohérent avant de commencer. Détecter les problèmes dès le début permet d'éviter un gaspillage de ressources informatiques et d'améliorer les performances du modèle.
Commencez par effectuer des essais rapides : lancez d'abord de petits tests avec un nombre réduit d'époques pour vérifier votre configuration. Cela vous permettra de détecter les problèmes à un stade précoce sans vous engager dans des tâches d'apprentissage longues et coûteuses. D'une certaine manière, vous créez ainsi un modèle que vous pourrez réutiliser et adapter à plus grande échelle une fois que tout fonctionnera comme prévu.
Surveillez les indicateurs clés : suivez des indicateurs tels que la perte, mAP, la précision et le rappel tout au long de l'entraînement. Ces indicateurs servent de repères pour évaluer les performances du modèle et vous aident à déterminer quand l'ajuster ou l'arrêter.
Veillez à l'efficacité des pipelines de traitement des données : assurez-vous que le chargement et le prétraitement des données s'effectuent efficacement, car ces opérations mobilisent CPU et peuvent constituer des goulots d'étranglement qui nuisent aux performances globales de l'apprentissage.
Utilisez les outils intégrés : servez-vous des graphiques, des journaux de console et des indicateurs système pour surveiller la formation en temps réel et prendre rapidement des décisions éclairées.
Principaux points à retenir
Pour choisir le GPU cloud adapté GPU la vision par ordinateur sur Ultralytics , il est essentiel de bien cerner votre charge de travail, notamment la taille de l'ensemble de données, la complexité du modèle et la configuration d'entraînement. Grâce à une gamme GPU disponibles, s'appuyant sur une infrastructure cloud et des machines virtuelles, vous pouvez commencer par un choix équilibré, puis évoluer à mesure que vos besoins en matière d'entraînement ou de réglage fin de modèles augmentent. En combinant le matériel adéquat avec des bonnes pratiques telles que la surveillance et le contrôle des coûts, vous pouvez entraîner efficacement des modèles d'intelligence artificielle de pointe tout en tirant pleinement parti de la flexibilité du calcul haute performance.