En cliquant sur « Accepter tous les cookies », vous acceptez le stockage de cookies sur votre appareil pour améliorer la navigation sur le site, analyser son utilisation et contribuer à nos efforts de marketing. Plus d’infos
Paramètres des cookies
En cliquant sur « Accepter tous les cookies », vous acceptez le stockage de cookies sur votre appareil pour améliorer la navigation sur le site, analyser son utilisation et contribuer à nos efforts de marketing. Plus d’infos
Explorez la différence entre l'inférence en temps réel et l'inférence par lots lors de l'utilisation d'Ultralytics YOLO11 pour diverses applications de vision par ordinateur.
Si vous avez vu une voiture autonome en action, vous avez été témoin d'inférence d'IA en temps réel. Une voiture autonome utilise généralement des caméras, des capteurs et l'IA pour traiter son environnement et prendre des décisions presque instantanées. Cependant, lorsque des réponses rapides ne sont pas nécessaires, l'inférence en temps réel peut être gourmande en ressources.
Une meilleure option dans ces cas est l'inférence par lots. Au lieu de traiter les données en continu et en temps réel, une inférence par lots peut traiter de grands ensembles de données à intervalles réguliers. Cette approche permet d'économiser des ressources, de réduire la consommation d'énergie et de diminuer les coûts d'infrastructure.
Par exemple, dans les applications de vision par ordinateur, les modèles comme Ultralytics YOLO11 peuvent être utilisés pour des tâches en temps réel comme la détection d'objets et la segmentation d'instances. Cependant, le traitement de grands volumes de données visuelles en temps réel peut être exigeant.
Fig 1. Un exemple de segmentation d'objets dans une image à l'aide de YOLO11.
Grâce à l'inférence par lots, YOLO11 peut être exécuté sur des données visuelles par lots, ce qui réduit la pression sur le système et améliore l'efficacité sans sacrifier les performances. Il est ainsi plus facile de déployer des solutions de Vision IA à grande échelle sans surcharger le matériel ni augmenter les coûts.
Dans cet article, nous allons explorer l'inférence par lots, ses avantages et comment l'inférence par lots utilisant YOLO11 peut être appliquée dans les applications de vision par ordinateur. Commençons !
Un aperçu de l'inférence par lots en vision par ordinateur
Vous pouvez considérer l'inférence par lots comme la résolution d'une tâche importante en une seule fois, au lieu de la traiter élément par élément au fur et à mesure. Au lieu de traiter constamment les données en temps réel, l'inférence par lots vous permet de traiter de grands ensembles de données à intervalles définis. Cette approche est beaucoup plus efficace lorsque des réponses immédiates ne sont pas nécessaires, ce qui permet d'économiser des ressources informatiques, de réduire la consommation d'énergie et de diminuer les coûts.
En matière de vision par ordinateur, il existe certaines applications où une faible latence est vitale. La faible latence fait référence au délai minimal entre la réception d'une entrée (telle qu'une image ou une trame vidéo) et la réponse du système. Par exemple, dans la surveillance de sécurité en temps réel, même de petits retards peuvent entraîner des risques pour la sécurité.
Cependant, dans de nombreux autres scénarios de vision par ordinateur, une faible latence n'est pas aussi critique. C'est là que l'inférence par lots brille - lorsque le système n'a pas besoin de réagir instantanément. L'inférence par lots fonctionne en alimentant un modèle de vision par ordinateur avec des données visuelles en groupes ou en lots, ce qui permet au système de traiter de grands ensembles de données en une seule fois plutôt que continuellement en temps réel.
Comprendre le fonctionnement de l'inférence par lots
Voici un aperçu plus détaillé des étapes impliquées dans l'inférence par lots :
Collecte de données : Les données visuelles sont collectées sur une période donnée. Cela peut inclure des images de sécurité, des images de produits ou des données clients, selon l’application.
Préparation des lots : Les données collectées sont ensuite regroupées en lots. Au cours de cette étape, les données sont formatées selon les exigences du modèle. Par exemple, les images peuvent être redimensionnées, normalisées ou converties au format approprié pour que le modèle puisse les traiter.
Prédiction : Une fois les données préparées, l'ensemble du lot est introduit dans le modèle (tel que YOLO11), qui traite l'ensemble du lot en une seule fois. Cela permet au modèle de faire des prédictions pour toutes les données du lot simultanément, ce qui rend le processus plus efficace que de traiter chaque point de données individuellement.
Quand utiliser l'inférence par lots ?
Maintenant que nous avons couvert ce qu'est l'inférence par lots et en quoi elle diffère de l'inférence en temps réel, examinons de plus près quand l'utiliser.
L'inférence par lots est idéale pour analyser les données historiques. Supposons que vous ayez des images de surveillance d'une station de métro sur le mois dernier, et que vous essayiez d'identifier des schémas spécifiques, tels que le nombre de personnes entrant et sortant à différents moments de la journée.
Au lieu de traiter chaque trame en temps réel, l'inférence par lots vous permet de traiter l'ensemble des séquences du mois par lots, en identifiant les événements ou les tendances clés sans avoir besoin de résultats immédiats. De cette façon, vous pouvez analyser de grands volumes de données plus efficacement et obtenir des informations sur les tendances à long terme, sans surcharger le système ni nécessiter une surveillance constante.
L'inférence par lots est également une solution optimale lorsque les ressources du système sont limitées. En exécutant l'inférence pendant les heures creuses (comme la nuit), vous pouvez économiser sur les coûts de calcul et vous assurer que le système n'est pas surchargé pendant les périodes de pointe. Cela en fait une approche efficace et rentable pour les entreprises ou les projets qui ont besoin de traiter de grands ensembles de données mais qui n'ont pas besoin d'une analyse en temps réel.
Inférence par lots utilisant Ultralytics YOLO11
Le package Python Ultralytics prend en charge l'inférence par lots pour les modèles tels que YOLO11. Avec YOLO11, vous pouvez facilement exécuter l'inférence par lots en spécifiant l'argument « batch », qui détermine le nombre d'images ou de trames vidéo traitées simultanément.
Pendant le processus d'inférence par lots, des prédictions sont générées simultanément pour toutes les images du lot. Par défaut, la taille du lot est fixée à 1, mais vous pouvez l'ajuster au nombre que vous préférez.
Par exemple, si la taille du lot est fixée à 5, YOLO11 traitera cinq images ou trames vidéo à la fois et générera des prédictions pour les cinq simultanément. Des tailles de lot plus importantes conduisent généralement à des temps d'inférence plus rapides, car le traitement de plusieurs images en lot est plus efficace que leur traitement individuel.
Applications de vision par ordinateur activées par l'inférence par lots
Ensuite, explorons quelques cas d'utilisation concrets de la vision par ordinateur pour l'inférence par lots.
Améliorer les diagnostics et la recherche dans le domaine de la santé
En recherche médicale, il est très courant de travailler avec de grandes quantités de données visuelles. Ici, l'inférence par lots peut aider les scientifiques à analyser plus facilement les données dans des domaines comme la chimie, la biologie et la génétique. Au lieu d'analyser les données une par une, elles sont traitées par lots, ce qui permet d'économiser du temps et des efforts.
Par exemple, dans les établissements médicaux, l'inférence par lots peut être particulièrement utile pour analyser de grands ensembles d'images médicales comme les IRM ou les tomodensitométries. Les hôpitaux peuvent collecter ces scans tout au long de la journée et les traiter par lots pendant la nuit.
Cette approche permet aux hôpitaux de mieux utiliser leur matériel et leur personnel, de réduire les coûts opérationnels et de s'assurer que tous les examens sont passés en revue de manière cohérente et uniforme. Elle est également bénéfique pour les grands projets de recherche et les études à long terme, où la gestion de grandes quantités de données est nécessaire.
Fig 2. Détection d'un scan médical à l'aide de YOLO11.
Amélioration des véhicules autonomes grâce à des simulations
Les voitures autonomes utilisent des technologies d'IA comme la vision par ordinateur pour traiter le monde qui les entoure. Grâce à des modèles avancés comme YOLO11, les systèmes embarqués de la voiture peuvent reconnaître d'autres véhicules, les lignes de démarcation, les panneaux de signalisation et les personnes dans la rue. Bien que l'inférence en temps réel soit essentielle sur la route, la technologie de conduite autonome repose également fortement sur l'inférence par lots en arrière-plan.
Fig. 3. YOLO11 peut facilement détecter les piétons sur la route.
Une fois qu'une voiture a terminé un trajet, les données qu'elle collecte, telles que les heures d'enregistrement de la caméra, les relevés de capteurs et les scans LIDAR, peuvent être traitées ultérieurement par lots importants. Cela permet aux ingénieurs de mettre à jour les modèles d'IA de la voiture, d'améliorer la sécurité du système et d'améliorer sa capacité à gérer diverses conditions de conduite.
L'inférence par lots est également utilisée dans les simulations de conduite autonome pour tester la façon dont les voitures autonomes réagiraient dans différentes situations, comme la navigation dans des intersections fréquentées ou la réaction aux mouvements imprévisibles des piétons. Cette approche permet de gagner du temps, de réduire les coûts et d'éviter les risques liés aux tests de chaque scénario dans la vie réelle.
Analyse des données de vente au détail basée sur l'inférence par lots
De même, pour les commerces de détail, l'inférence par lots avec des modèles de vision par ordinateur comme YOLO11 peut améliorer considérablement l'efficacité opérationnelle. Par exemple, les systèmes de caméras dans les magasins peuvent capturer des milliers d'images tout au long de la journée, qui peuvent ensuite être traitées par lots pendant la nuit.
Cela permet aux magasins d'analyser ce qui se passe dans le magasin, comme le comportement des clients, les schémas de circulation et les interactions avec les produits, sans avoir besoin d'un traitement en temps réel, ce qui peut être difficile pour les petits magasins.
Un autre exemple intéressant est l'utilisation de l'inférence par lots pour générer des cartes thermiques, qui visualisent les zones d'activité client élevée et faible dans le magasin. En analysant ces cartes thermiques, les détaillants peuvent identifier les zones qui attirent le plus de trafic piétonnier et les parties du magasin qui pourraient nécessiter plus d'attention ou une optimisation du placement des produits. Ces données peuvent aider les détaillants à prendre de meilleures décisions concernant l'aménagement du magasin, le positionnement des produits et même les stratégies promotionnelles pour améliorer l'expérience client et les ventes.
Fig 4. Les cartes thermiques peuvent aider les détaillants à identifier les zones populaires dans les magasins.
Avantages et inconvénients de l'inférence par lots
Voici quelques-uns des principaux avantages que l'inférence par lots peut apporter à divers secteurs :
Facilité d'intégration : L'inférence par lots peut être facilement intégrée aux flux de travail existants, en particulier pour les secteurs tels que la vente au détail, la sécurité ou la santé, où de grands volumes de données doivent être traités en masse.
Gestion des données plus facile : Lorsque vous travaillez avec de grandes quantités de données, l'inférence par lots peut simplifier la gestion des données, car les données sont regroupées en blocs gérables. Cela facilite le suivi, la révision et l'organisation des données au fil du temps.
Charge réseau réduite : Lorsque les données sont traitées par lots, la quantité de données transférées à un moment donné peut être minimisée, ce qui réduit la pression sur les ressources réseau dans les systèmes basés sur le cloud ou les environnements informatiques distribués.
Bien qu'il existe de nombreux avantages à utiliser l'inférence par lots, il existe également certaines limites à prendre en compte. Voici quelques facteurs à garder à l'esprit :
Exigences de stockage : Le stockage d’ensembles de données volumineux pour le traitement par lots peut augmenter considérablement les coûts de stockage, en particulier avec des images, des vidéos haute résolution ou de grands volumes de données.
Potentiel d'arriéré : Si les données s'accumulent rapidement ou si de grands lots ne sont pas traités à temps, un arriéré peut se développer. Cela peut entraîner des retards dans la fourniture d'informations et le traitement de nouvelles données en temps opportun.
Pics de ressources : Les lots importants, en particulier ceux impliquant des images haute résolution, peuvent provoquer des pics d’utilisation de la mémoire ou du calcul. S’ils ne sont pas correctement gérés, ces pics peuvent submerger les systèmes, entraînant des ralentissements ou des plantages.
Principaux points à retenir
L'inférence par lots est un moyen efficace de traiter de grands volumes de données visuelles qui ne nécessitent pas de résultats immédiats. Plutôt que d'analyser chaque image en temps réel, elle les traite par lots à des moments programmés, comme la nuit.
Cette méthode est rentable, réduit la charge de calcul et fournit toujours des résultats précis. Qu'il s'agisse d'aider les magasins à gérer leurs stocks, d'aider les médecins à analyser les scans médicaux ou d'améliorer les technologies des voitures autonomes, l'inférence par lots rend la vision par ordinateur plus accessible, abordable et pratique pour les applications du monde réel.