Utiliser Ultralytics YOLO11 pour exécuter des inférences par lots
Explore la différence entre l'inférence en temps réel et l'inférence par lots lors de l'utilisation d'Ultralytics YOLO11 pour diverses applications de vision par ordinateur.

Si tu as déjà vu une voiture autonome en action, tu as été témoin de l'inférence IA en temps réel. Une voiture autonome utilise généralement des caméras, des capteurs et l'IA pour traiter son environnement et prendre des décisions presque instantanées. Cependant, lorsque des réponses rapides ne sont pas nécessaires, l'inférence en temps réel peut être gourmande en ressources.
Une meilleure option dans ces cas-là est l'inférence par lots. Au lieu de traiter les données en continu en temps réel, l'inférence par lots peut gérer de grands ensembles de données à des intervalles programmés. Cette approche aide à économiser des ressources, à réduire la consommation d'énergie et à diminuer les coûts d'infrastructure.
Par exemple, dans les applications de vision par ordinateur, des modèles comme Ultralytics YOLO11 peuvent être utilisés pour des tâches en temps réel comme la détection d'objets et la segmentation d'instances. Cependant, le traitement de grands volumes de données visuelles en temps réel peut être exigeant.

Fig 1. Un exemple de segmentation d'objets dans une image à l'aide de YOLO11.
Avec l'inférence par lots, YOLO11 peut être exécuté sur des données visuelles par lots, réduisant la pression sur le système et améliorant l'efficacité sans sacrifier les performances. Cela facilite le déploiement de solutions de Vision AI à grande échelle sans surcharger le matériel ni augmenter les coûts.
Dans cet article, nous explorerons l'inférence par lots, ses avantages, et comment l'inférence par lots avec YOLO11 peut être appliquée dans les applications de vision par ordinateur. Commençons !
Link to this sectionUn aperçu de l'inférence par lots en vision par ordinateur#
Tu peux considérer l'inférence par lots comme la résolution d'une grosse tâche en une seule fois plutôt que de la traiter petit à petit au fur et à mesure. Au lieu de traiter constamment des données en temps réel, l'inférence par lots te permet de traiter de grands groupes de données à des intervalles définis. Cette approche est beaucoup plus efficace lorsque des réponses immédiates ne sont pas nécessaires, ce qui aide à économiser des ressources informatiques, à réduire la consommation d'énergie et à diminuer les coûts.
En ce qui concerne la vision par ordinateur, il existe certaines applications où une faible latence est essentielle. Une faible latence fait référence au délai minimal entre la réception d'une entrée (comme une image ou une image vidéo) et la réponse du système. Par exemple, dans la surveillance de sécurité en temps réel, même de petits délais peuvent entraîner des risques pour la sécurité.
Cependant, dans de nombreux autres scénarios de vision par ordinateur, une faible latence n'est pas aussi critique. C'est là que l'inférence par lots brille : lorsque le système n'a pas besoin de réagir instantanément. L'inférence par lots fonctionne en envoyant des données visuelles à un modèle de vision par ordinateur par groupes ou lots, permettant au système de traiter de grands ensembles de données à la fois plutôt qu'en continu en temps réel.
Link to this sectionComprendre le fonctionnement de l'inférence par lots#
Voici un examen plus approfondi des étapes impliquées dans l'inférence par lots :
-
Collecte de données : Les données visuelles sont collectées sur une période de temps. Cela pourrait inclure des séquences de sécurité, des images de produits ou des données clients, selon l'application.
-
Préparation par lots : Les données collectées sont ensuite regroupées en lots. Au cours de cette étape, les données sont formatées selon les exigences du modèle. Par exemple, les images peuvent être redimensionnées, normalisées ou converties au format approprié pour le traitement par le modèle.
-
Prédiction** :** Une fois les données préparées, le lot entier est envoyé dans le modèle (tel que YOLO11), qui traite tout le lot en une seule fois. Cela permet au modèle de faire des prédictions pour toutes les données du lot simultanément, rendant le processus plus efficace par rapport au traitement de chaque point de données individuellement.
Link to this sectionQuand utiliser l'inférence par lots ?#
Maintenant que nous avons couvert ce qu'est l'inférence par lots et comment elle diffère de l'inférence en temps réel, regardons de plus près quand l'utiliser.
L'inférence par lots est idéale pour analyser des données historiques. Disons que tu as des images de surveillance d'une station de métro sur le mois dernier, et que tu essaies d'identifier des modèles spécifiques, comme le nombre de personnes entrant et sortant à différents moments de la journée.
Au lieu de traiter chaque image en temps réel, l'inférence par lots te permet de traiter tout le mois de séquences par lots, en identifiant des événements ou des tendances clés sans avoir besoin de résultats immédiats. De cette façon, tu peux analyser de grands volumes de données plus efficacement et obtenir des informations sur les tendances à long terme, sans surcharger le système ni nécessiter une surveillance constante.
L'inférence par lots est également une solution optimale lorsque les ressources système sont limitées. En exécutant l'inférence pendant les heures creuses (comme pendant la nuit), tu peux économiser sur les coûts informatiques et t'assurer que le système n'est pas surchargé pendant les périodes de forte utilisation. Cela en fait une approche efficace et rentable pour les entreprises ou les projets qui ont besoin de traiter de grands ensembles de données mais qui ne nécessitent pas d'analyse en temps réel.
Link to this sectionInférence par lots avec Ultralytics YOLO11#
Le package Python Ultralytics prend en charge l'inférence par lots pour des modèles comme YOLO11. Avec YOLO11, tu peux facilement exécuter une inférence par lots en spécifiant l'argument « batch », qui détermine combien d'images ou d'images vidéo sont traitées à la fois.
Pendant le processus d'inférence par lots, des prédictions sont générées pour toutes les images du lot simultanément. Par défaut, la taille du lot est réglée sur 1, mais tu peux l'ajuster au nombre que tu préfères.
Par exemple, si la taille du lot est définie sur 5, YOLO11 traitera cinq images ou images vidéo à la fois et générera des prédictions pour les cinq en une seule fois. Des tailles de lot plus grandes conduisent généralement à des temps d'inférence plus rapides, car le traitement de plusieurs images dans un lot est plus efficace que leur traitement individuel.
Link to this sectionApplications de vision par ordinateur activées par l'inférence par lots#
Ensuite, explorons quelques cas d'utilisation concrets de vision par ordinateur pour l'inférence par lots.
Link to this sectionAméliorer les diagnostics et la recherche dans la santé#
Dans la recherche médicale, travailler avec de grandes quantités de données visuelles est très courant. Ici, l'inférence par lots peut aider les scientifiques à analyser les données plus facilement dans des domaines comme la chimie, la biologie et la génétique. Au lieu d'analyser une par une, les données sont traitées par lots, ce qui permet d'économiser du temps et des efforts.
Par exemple, dans les établissements médicaux, l'inférence par lots peut être particulièrement utile pour analyser de grands ensembles d'images médicales comme des IRM ou des scanners CT. Les hôpitaux peuvent collecter ces scans tout au long de la journée et les traiter par lots pendant la nuit.
Cette approche permet aux hôpitaux de mieux utiliser leur matériel et leur personnel, de réduire les coûts opérationnels et de garantir que tous les scans sont examinés de manière cohérente et uniforme. C'est également bénéfique pour les grands projets de recherche et les études à long terme, où la gestion de vastes quantités de données est nécessaire.

Fig 2. Détection d'un scan médical avec YOLO11.
Link to this sectionAméliorer les véhicules autonomes grâce aux simulations#
Les voitures autonomes utilisent des technologies d'IA comme la vision par ordinateur pour traiter le monde qui les entoure. Avec l'aide de modèles avancés comme YOLO11, les systèmes embarqués dans la voiture peuvent reconnaître d'autres véhicules, les lignes de voie, les panneaux de signalisation et les personnes dans la rue. Bien que l'inférence en temps réel soit critique sur la route, la technologie de conduite autonome s'appuie également fortement sur l'inférence par lots en arrière-plan.

Fig 3. YOLO11 peut facilement détecter les piétons sur la route.
Après qu'une voiture termine un trajet, les données qu'elle collecte, telles que des heures d'images de caméra, des lectures de capteurs et des scans LIDAR, peuvent être traitées ultérieurement par grands lots. Cela permet aux ingénieurs de mettre à jour les modèles d'IA de la voiture, d'améliorer la sécurité du système et d'améliorer sa capacité à gérer diverses conditions de conduite.
L'inférence par lots est également utilisée dans les simulations de conduite autonome pour tester comment les voitures autonomes réagiraient dans différentes situations, comme naviguer dans des intersections occupées ou répondre à des mouvements imprévisibles de piétons. Cette approche permet de gagner du temps, de réduire les coûts et d'éviter les risques associés au test de chaque scénario dans la vie réelle.
Link to this sectionAnalyse des données de vente au détail pilotée par l'inférence par lots#
De même, pour les magasins de détail, l'inférence par lots avec des modèles de vision par ordinateur comme YOLO11 peut améliorer considérablement l'efficacité opérationnelle. Par exemple, les systèmes de caméras dans les magasins peuvent capturer des milliers d'images tout au long de la journée, qui peuvent ensuite être traitées par lots pendant la nuit.
Cela permet aux magasins d'analyser ce qui se passe dans le magasin, comme le comportement des clients, les modèles de trafic et les interactions avec les produits, sans avoir besoin d'un traitement en temps réel, ce qui peut être difficile pour les petits magasins.
Un autre exemple intéressant est l'utilisation de l'inférence par lots pour générer des cartes thermiques, qui visualisent les zones d'activité client élevée et faible dans le magasin. En analysant ces cartes thermiques, les détaillants peuvent identifier quelles zones attirent le plus de trafic piétonnier et quelles parties du magasin pourraient nécessiter plus d'attention ou une optimisation du placement des produits. Ces données peuvent aider les détaillants à prendre de meilleures décisions sur l'agencement du magasin, le positionnement des produits et même les stratégies promotionnelles pour améliorer l'expérience client et les ventes.

Fig 4. Les cartes thermiques peuvent aider les détaillants à identifier les zones populaires dans les magasins.
Link to this sectionAvantages et inconvénients de l'inférence par lots#
Voici quelques-uns des principaux avantages que l'inférence par lots peut apporter à diverses industries :
- Facilité d'intégration : L'inférence par lots peut être facilement intégrée dans les flux de travail existants, en particulier pour des industries comme la vente au détail, la sécurité ou la santé, où de grands volumes de données doivent être traités en vrac.
- Gestion des données plus facile : Lorsque tu travailles avec de grandes quantités de données, l'inférence par lots peut rationaliser la gestion des données car les données sont regroupées en blocs gérables. Cela facilite le suivi, l'examen et l'organisation des données au fil du temps.
- Charge réseau réduite : Lorsque les données sont traitées par lots, la quantité de données transférées à un moment donné peut être minimisée, réduisant la pression sur les ressources réseau dans les systèmes basés sur le cloud ou les environnements informatiques distribués.
Bien qu'il y ait de nombreux avantages à utiliser l'inférence par lots, il existe également certaines limites à prendre en compte. Voici quelques facteurs à garder à l'esprit :
- Exigences de stockage : Le stockage de grands ensembles de données pour le traitement par lots peut augmenter considérablement les coûts de stockage, en particulier avec des images haute résolution, des vidéos ou de grands volumes de données.
- Potentiel de retard : Si les données s'accumulent rapidement ou si de grands lots ne sont pas traités à temps, un retard peut se développer. Cela peut entraîner des délais dans la fourniture d'informations et le traitement de nouvelles données en temps opportun.
- Pics de ressources : Les grands lots, en particulier ceux impliquant des images haute résolution, peuvent provoquer des pics de mémoire ou d'utilisation du calcul. S'ils ne sont pas correctement gérés, ces pics peuvent surcharger les systèmes, entraînant des ralentissements ou des plantages.
Link to this sectionPoints clés#
L'inférence par lots est un moyen efficace de traiter de grands volumes de données visuelles qui ne nécessitent pas de résultats immédiats. Plutôt que d'analyser chaque image en temps réel, elle les traite par lots à des heures programmées, comme pendant la nuit.
Cette méthode est rentable, réduit la charge de calcul et fournit toujours des résultats précis. Qu'il s'agisse d'aider les magasins à gérer les stocks, d'assister les médecins dans l'analyse de scans médicaux ou d'améliorer les technologies de voitures autonomes, l'inférence par lots rend la vision par ordinateur plus accessible, abordable et pratique pour des applications réelles.
Prêt à plonger dans l'IA ? Explore notre dépôt GitHub, connecte-toi avec notre communauté et consulte nos options de licence pour commencer ton parcours en vision par ordinateur. Découvre-en plus sur des innovations comme l'IA dans la fabrication et la vision par ordinateur dans l'industrie logistique sur nos pages de solutions.






