Explore la différence entre l'inférence en temps réel et l'inférence par lots lors de l'utilisation d'Ultralytics YOLO11 pour diverses applications de vision par ordinateur.
Si tu as vu une voiture auto-conduite en action, tu as été témoin de l'inférence de l'IA en temps réel. Une voiture auto-conduite utilise généralement des caméras, des capteurs et l'IA pour traiter son environnement et prendre des décisions presque instantanées. Cependant, lorsque des réponses rapides ne sont pas nécessaires, l'inférence en temps réel peut être gourmande en ressources.
Une meilleure option dans ces cas est l'inférence par lots. Au lieu de traiter les données en continu et en temps réel, une inférence par lots peut traiter de grands ensembles de données à intervalles programmés. Cette approche permet d'économiser des ressources, de réduire la consommation d'énergie et de diminuer les coûts d'infrastructure.
Par exemple, dans les applications de vision par ordinateur, des modèles comme Ultralytics YOLO11 peuvent être utilisés pour des tâches en temps réel telles que la détection d'objets et la segmentation d'instances. Cependant, le traitement de grands volumes de données visuelles en temps réel peut être exigeant.
Grâce à l'inférence par lots, YOLO11 peut être exécuté sur des données visuelles par lots, ce qui réduit la sollicitation du système et améliore l'efficacité sans sacrifier les performances. Il est ainsi plus facile de déployer des solutions Vision AI à grande échelle sans surcharger le matériel ni augmenter les coûts.
Dans cet article, nous allons explorer l'inférence par lots, ses avantages et la façon dont l 'inférence par lots à l'aide de YOLO11 peut être appliquée dans les applications de vision par ordinateur. C'est parti !
Tu peux considérer l'inférence par lots comme le fait de s'attaquer à une tâche importante en une seule fois au lieu de la traiter morceau par morceau au fur et à mesure qu'elle arrive. Au lieu de traiter constamment les données en temps réel, l'inférence par lots te permet de traiter de grands groupes de données à intervalles fixes. Cette approche est beaucoup plus efficace lorsque des réponses immédiates ne sont pas nécessaires, ce qui permet d'économiser les ressources informatiques, de réduire la consommation d'énergie et de diminuer les coûts.
Dans le domaine de la vision par ordinateur, il existe certaines applications pour lesquelles une faible latence est vitale. Une faible latence fait référence au délai minimal entre la réception d'une entrée (telle qu'une image ou une trame vidéo) et la réponse du système. Par exemple, dans le cadre de la surveillance de la sécurité en temps réel, même de petits retards peuvent entraîner des risques pour la sécurité.
Cependant, dans de nombreux autres scénarios de vision par ordinateur, une faible latence n'est pas aussi critique. C'est là que l'inférence par lots se distingue - lorsque le système n'a pas besoin de réagir instantanément. L'inférence par lots consiste à transmettre des données visuelles à un modèle de vision artificielle par groupes ou par lots, ce qui permet au système de traiter de grands ensembles de données en une seule fois plutôt qu'en continu et en temps réel.
Voici un examen plus approfondi des étapes de l'inférence par lots :
Maintenant que nous avons expliqué ce qu'est l'inférence par lots et en quoi elle diffère de l'inférence en temps réel, examinons de plus près quand l'utiliser.
L'inférence par lots est idéale pour analyser les données historiques. Disons que tu as des images de surveillance d'une station de métro au cours du dernier mois, et que tu essayes d'identifier des modèles spécifiques, comme le nombre de personnes qui entrent et sortent à différents moments de la journée.
Au lieu de traiter chaque image en temps réel, l'inférence par lots te permet de traiter l'ensemble des séquences d'un mois par lots, en identifiant les événements ou les tendances clés sans avoir besoin de résultats immédiats. De cette façon, tu peux analyser de grands volumes de données plus efficacement et obtenir des informations sur les modèles à long terme, sans submerger le système ni nécessiter une surveillance constante.
L'inférence par lots est également une solution optimale lorsque les ressources du système sont limitées. En exécutant l'inférence pendant les heures creuses (comme la nuit), tu peux économiser sur les coûts informatiques et t'assurer que le système n'est pas surchargé pendant les heures de pointe. Cela en fait une approche efficace et rentable pour les entreprises ou les projets qui ont besoin de traiter de grands ensembles de données mais qui ne nécessitent pas d'analyse en temps réel.
Le packageUltralytics Python prend en charge l'inférence par lots pour les modèles tels que YOLO11. Avec YOLO11, tu peux facilement exécuter une inférence par lot en spécifiant l'argument 'batch', qui détermine combien d'images ou de trames vidéo sont traitées en même temps.
Au cours du processus d'inférence par lot, les prédictions sont générées pour toutes les images du lot simultanément. Par défaut, la taille du lot est fixée à 1, mais tu peux l'ajuster à la valeur de ton choix.
Par exemple, si la taille du lot est fixée à 5, YOLO11 traitera cinq images ou trames vidéo à la fois et générera des prédictions pour les cinq en même temps. Des lots plus importants permettent généralement d'obtenir des temps d'inférence plus rapides, car il est plus efficace de traiter plusieurs images en un seul lot que de les traiter individuellement.
Ensuite, explorons quelques cas réels d'utilisation de la vision par ordinateur pour l'inférence par lots.
Dans la recherche médicale, il est très courant de travailler avec de grandes quantités de données visuelles. Ici, l'inférence par lots peut aider les scientifiques à analyser plus facilement les données dans des domaines tels que la chimie, la biologie et la génétique. Au lieu de les analyser une par une, les données sont traitées par lots, ce qui permet d'économiser du temps et des efforts.
Par exemple, dans les établissements médicaux, l'inférence par lots peut être particulièrement utile pour analyser de grands ensembles d'images médicales comme les IRM ou les tomodensitogrammes. Les hôpitaux peuvent collecter ces scans tout au long de la journée et les traiter par lots pendant la nuit.
Cette approche permet aux hôpitaux de mieux utiliser leur matériel et leur personnel, de réduire les coûts opérationnels et de s'assurer que tous les scans sont examinés de manière cohérente et uniforme. Elle est également bénéfique pour les grands projets de recherche et les études à long terme, où la manipulation de grandes quantités de données est nécessaire.
Les voitures auto-conduites utilisent des technologies d'IA comme la vision par ordinateur pour traiter le monde qui les entoure. Avec l'aide de modèles avancés comme YOLO11, les systèmes embarqués sur la voiture peuvent reconnaître les autres véhicules, les lignes de voie, les panneaux de signalisation et les personnes dans la rue. Si l'inférence en temps réel est essentielle sur la route, la technologie de conduite autonome s'appuie aussi fortement sur l'inférence par lots en coulisses.
Une fois qu'une voiture a terminé un trajet, les données qu'elle recueille, telles que les heures de séquences de caméra, les lectures de capteurs et les balayages LIDAR, peuvent être traitées ultérieurement en grands lots. Les ingénieurs peuvent ainsi mettre à jour les modèles d'IA de la voiture, renforcer la sécurité du système et améliorer sa capacité à gérer différentes conditions de conduite.
L'inférence par lots est également utilisée dans les simulations de conduite autonome pour tester la façon dont les voitures auto-conduites réagiraient dans différentes situations, comme la navigation dans des intersections très fréquentées ou la réponse à des mouvements de piétons imprévisibles. Cette approche permet de gagner du temps, de réduire les coûts et d'éviter les risques associés au test de chaque scénario en situation réelle.
De même, pour les magasins de détail, l'inférence par lots avec des modèles de vision par ordinateur comme YOLO11 peut considérablement améliorer l'efficacité opérationnelle. Par exemple, les systèmes de caméras des magasins peuvent capturer des milliers d'images tout au long de la journée, qui peuvent ensuite être traitées par lots pendant la nuit.
Cela permet aux magasins d'analyser ce qui se passe dans le magasin, comme le comportement des clients, les schémas de circulation et les interactions avec les produits, sans avoir besoin d'un traitement en temps réel, ce qui peut représenter un défi pour les petits magasins.
Un autre exemple intéressant consiste à utiliser l'inférence par lot pour générer des cartes thermiques, qui visualisent les zones de forte et de faible activité des clients dans le magasin. En analysant ces cartes thermiques, les détaillants peuvent identifier les zones qui attirent le plus de piétons et les parties du magasin qui pourraient nécessiter plus d'attention ou une optimisation du placement des produits. Ces données peuvent aider les détaillants à prendre de meilleures décisions sur l'agencement du magasin, le positionnement des produits et même les stratégies promotionnelles afin d'améliorer l'expérience des clients et les ventes.
Voici quelques-uns des principaux avantages que l'inférence par lots peut apporter à divers secteurs d'activité :
Bien qu'il y ait de nombreux avantages à utiliser l'inférence par lots, il y a aussi certaines limites à prendre en compte. Voici quelques facteurs à prendre en compte :
L'inférence par lots est un moyen efficace de traiter de grands volumes de données visuelles qui ne nécessitent pas de résultats immédiats. Plutôt que d'analyser chaque image en temps réel, il les traite par lots à des moments programmés, comme la nuit.
Cette méthode est rentable, réduit la charge de calcul et fournit toujours des résultats précis. Qu'il s'agisse d'aider les magasins à gérer leurs stocks, d'assister les médecins dans l'analyse des scanners médicaux ou d'améliorer les technologies de voitures autonomes, l'inférence par lots rend la vision par ordinateur plus accessible, plus abordable et plus pratique pour les applications du monde réel.
Prêt à plonger dans l'IA ? Explore notre dépôt GitHub, connecte-toi avec notre communauté et consulte nos options de licence pour commencer ton voyage dans la vision par ordinateur. Découvre des innovations comme l'IA dans la fabrication et la vision par ordinateur dans le secteur de la logistique sur nos pages de solutions.
Commence ton voyage avec le futur de l'apprentissage automatique.