Construire des produits intelligents avec YOLO26 d'Ultralytics et la vision par IA
Apprends comment la création de produits intelligents avec YOLO26 et la vision par IA permet la détection en temps réel, l'automatisation intelligente et des expériences produit évolutives et réactives.
Des milliers d'heures de vidéo sont capturées chaque jour par des caméras intégrées dans des appareils, des machines et des infrastructures publiques. La plupart de ces images sont stockées, survolées ou examinées uniquement en cas de problème.
Souvent, les données visuelles sont disponibles, mais la capacité de les interpréter en temps réel fait défaut. À mesure que les produits deviennent plus connectés et axés sur les données, cette limite devient plus visible.
Les utilisateurs attendent des systèmes qu'ils fassent plus que simplement enregistrer des événements ou suivre des instructions figées. Par exemple, ils s'attendent à ce que les smart products reconnaissent ce qui se passe et réagissent immédiatement, sans attendre d'examens manuels ni dépendre d'ensembles de règles rigides.
Les avancées récentes dans l'intelligence artificielle aident à combler ce fossé. En particulier, la computer vision permet aux machines d'interpréter des images et des vidéos, ce qui permet aux systèmes d'analyser des scènes et de réagir en temps réel.
Cependant, intégrer cette capacité dans un produit nécessite des modèles à la fois rapides et fiables. Les modèles de computer vision de pointe comme Ultralytics YOLO26 sont conçus dans ce but, offrant la vitesse et la précision nécessaires pour un déploiement en temps réel.
YOLO26 prend en charge des tâches de vision fondamentales telles que la détection d'objets, la segmentation d'instance et le suivi d'objets, permettant ainsi aux produits d'interpréter les données visuelles et de réagir intelligemment.

Fig 1. Détection d'objets dans une image à l'aide de YOLO26 (Source)
Dans cet article, nous explorerons comment la computer vision et Ultralytics YOLO26 peuvent être utilisés pour construire des produits plus intelligents et soutenir l'automatisation intelligente dans des applications réelles. Commençons !
Link to this sectionLes lacunes du développement de produits traditionnel#
Avant de plonger dans la manière dont la computer vision aide à construire des produits plus intelligents, examinons de près les défis auxquels les équipes sont confrontées lorsqu'elles s'appuient sur des systèmes traditionnels basés sur des règles et des algorithmes plus anciens.
Voici certains des principaux défis du développement de produits traditionnel :
- Systèmes rigides basés sur des règles : Une logique codée en dur peut fonctionner dans des environnements contrôlés, mais les environnements réels sont rarement prévisibles. De petits changements dans l'éclairage, l'angle de la caméra ou l'apparence de l'objet peuvent rapidement briser les règles prédéfinies et réduire la précision.
- Faible adaptabilité à la variabilité du monde réel : Les systèmes traditionnels ne s'adaptent pas bien aux scénarios nouveaux ou inattendus. Les mises à jour nécessitent souvent des réglages manuels et une optimisation répétée, ce qui ralentit l'amélioration des produits et augmente les efforts de maintenance.
- Limites de scalabilité : À mesure que le volume de données d'images et de vidéos augmente, les pipelines de traitement d'image plus anciens peinent à suivre. Le traitement devient plus lent, ce qui rend difficile le maintien de performances en temps réel sur les flux vidéo.
- Latence élevée dans les scénarios en temps réel : De nombreuses approches traditionnelles ne peuvent pas traiter les flux visuels continus assez rapidement. Des sorties retardées affaiblissent l'automatisation et réduisent la réactivité globale.
- Exigences de calcul coûteuses : Atteindre une précision acceptable demande souvent des ressources matérielles importantes, y compris des unités de traitement graphique (GPU) dédiées, ce qui augmente les coûts d'infrastructure.
Link to this sectionLe rôle de la computer vision dans la construction de produits plus intelligents#
Ensuite, voyons comment la computer vision peut soutenir un comportement de produit plus intelligent.
La plupart des produits connectés d'aujourd'hui collectent déjà des données visuelles dans le cadre de leurs processus opérationnels normaux. Des caméras sont intégrées dans divers appareils, installées dans des espaces physiques et liées par le biais de systèmes Internet des objets (IoT).
En conséquence, des images et des vidéos sont constamment capturées en arrière-plan. Le défi ne réside pas dans la collecte de ces données.
La partie délicate consiste à donner un sens aux données collectées en temps réel. Sans intelligence visuelle, les images sont simplement stockées et examinées plus tard, souvent après qu'un problème soit déjà survenu.
La computer vision change cela. En utilisant des réseaux neuronaux entraînés à reconnaître des modèles, les systèmes peuvent analyser des images et des vidéos en temps réel. Au lieu de compter sur des règles fixes ou des vérifications manuelles, les produits peuvent interpréter ce qui se passe dans une scène et réagir à mesure que les événements se produisent.
Pour intégrer cette capacité visuelle dans les produits, les équipes peuvent s'appuyer sur des computer vision models efficaces tels qu'Ultralytics YOLO26. YOLO26 prend en charge des tâches de vision clés et peut aider les produits à interpréter les informations visuelles assez rapidement pour permettre des décisions en temps réel.
Link to this sectionLes briques de base des produits axés sur la vision#
Voici un aperçu rapide de la manière dont les computer vision tasks peuvent contribuer à des produits plus intelligents :
- Object detection : Cette tâche peut identifier et localiser les objets pertinents dans chaque image à l'aide d'une bbox et attribuer un score de confiance, offrant une compréhension claire de ce qui est présent dans une image.
- Object tracking : Elle peut être utilisée pour suivre des objets spécifiques à travers plusieurs images, permettant à un système de vision de comprendre le mouvement et les changements au fil du temps.
- Image classification : Cette tâche attribue une étiquette à une image entière en fonction de son contenu principal. Elle catégorise les scènes ou identifie des conditions spécifiques dans l'image.
- Instance segmentation : Elle peut délimiter précisément les objets au niveau du pixel, permettant aux produits de mieux interpréter les formes, les limites et les relations spatiales.
- Pose estimation : Cette tâche détecte des points clés sur le corps humain ou d'autres objets articulés. Elle capture la posture, le mouvement et les interactions physiques en temps réel.
- Oriented bounding box (OBB) detection : Elle peut détecter des objets en utilisant des boîtes englobantes pivotées au lieu des horizontales standard. Cela améliore la précision de localisation lorsque les objets apparaissent sous des angles ou dans des environnements très encombrés.
Lorsque ces capacités sont appliquées à des données visuelles continues, les produits peuvent réagir plus rapidement, s'automatiser de manière plus fiable et offrir des expériences qui semblent conscientes plutôt que réactives. Au lieu d'attendre que les événements soient examinés plus tard, les systèmes peuvent comprendre et agir sur le moment.
Link to this sectionComment les modèles de vision en temps réel permettent un comportement de produit intelligent#
Alors que tu en apprends davantage sur les produits axés sur la vision, tu te demandes peut-être comment un système passe du simple enregistrement vidéo à une réaction en temps réel.
Cela commence par la reconnaissance de ce qui se trouve devant la caméra. Au fur et à mesure que la vidéo arrive, un modèle de vision analyse chaque image et identifie les éléments importants, tels que des objets ou des personnes spécifiques. Au lieu de réagir à chaque mouvement, le système se concentre uniquement sur les signaux pertinents.
Un autre aspect clé est la vitesse. Les systèmes en temps réel doivent traiter chaque image rapidement et de manière cohérente, en garantissant que la détection et la prise de décision se produisent sans délai perceptible.
Par exemple, la famille de modèles Ultralytics YOLO (You Only Look Once) a été conçue pour traiter les données visuelles en temps réel. Des modèles comme Ultralytics YOLO26 s'appuient sur des versions antérieures telles que Ultralytics YOLOv5, Ultralytics YOLOv8 et Ultralytics YOLO11, intégrant des améliorations architecturales, des optimisations de performance et des améliorations de l'efficacité. Le résultat est une vitesse et une précision améliorées, même dans des conditions réelles exigeantes.
Une fois intégrés dans un produit, ces modèles s'exécutent en continu en arrière-plan, analysant chaque image à mesure qu'elle arrive. Le système vérifie les conditions prédéfinies et, une fois remplies, peut instantanément déclencher une alerte, mettre à jour un workflow ou initier une action.
Cela rend les systèmes axés sur la vision plus réactifs, évolutifs et pratiques pour une intégration dans des environnements allant de la robotique et des véhicules autonomes aux systèmes de domotique et de sécurité. Pour les dirigeants d'entreprise, cela se traduit par des réponses plus rapides, moins de vérifications manuelles et une automatisation qui semble fiable plutôt que réactive.
Link to this sectionUtiliser YOLO26 pour alimenter l'intelligence visuelle en temps réel dans les produits#
Les modèles Ultralytics YOLO, y compris YOLO26, sont disponibles prêts à l'emploi en tant que modèles pré-entraînés. Cela signifie qu'ils sont déjà entraînés sur de grands jeux de données largement utilisés, tels que le jeu de données COCO.
Grâce à ce pré-entraînement, YOLO26 peut immédiatement reconnaître des objets réels courants. Cela donne aux équipes produit un point de départ pratique, ce qui signifie qu'elles peuvent construire des fonctionnalités visuelles sans entraîner un modèle à partir de zéro.
Pour des besoins produits plus spécifiques, ces modèles pré-entraînés peuvent être davantage affinés en utilisant des données spécifiques au domaine avec des annotations de haute qualité.
Par exemple, considère un restaurant équipé de caméras au plafond. Un modèle d'IA visuelle entraîné sur mesure comme YOLO26 peut détecter combien de personnes se trouvent à l'intérieur de l'espace. Il peut identifier quelles tables sont occupées et quelles chaises sont vides.

Fig 2. YOLO26 permet la détection en temps réel de personnes, d'espaces ouverts et de caisses avec personnel dans les magasins de détail. (Source)
Dans ce type de scénario, YOLO26 agit comme un moteur visuel fonctionnant en continu en arrière-plan. Les équipes peuvent également déployer de tels modèles sur des edge devices, en fonction des besoins de performance et des objectifs d'efficacité énergétique.
Link to this sectionApplications réelles des modèles YOLO dans les produits intelligents#
Maintenant que nous avons une meilleure compréhension du fonctionnement des modèles de vision en temps réel, examinons comment les modèles Ultralytics YOLO peuvent être appliqués dans des produits intelligents pour différents cas d'usage afin de les rendre plus conscients, réactifs et capables d'agir sur ce qu'ils voient.
Link to this sectionIntelligence produit dans le domaine de la santé avec YOLO#
En ce qui concerne la formation chirurgicale dans le domaine de la santé, des heures de séquences opératoires sont souvent examinées manuellement pour évaluer la manipulation des outils et le workflow. Ce processus peut prendre beaucoup de temps et dépendre fortement de l'observation humaine.
Avec un modèle de vision basé sur YOLO intégré au système, les flux vidéo peuvent être analysés automatiquement au fur et à mesure que les procédures ont lieu. Le modèle peut détecter les instruments chirurgicaux en temps réel et identifier où et quand ils sont utilisés.
Cela permet une journalisation structurée, des analyses améliorées et des insights de performance de haute qualité sans examen manuel constant. En fait, des recherches utilisant le modèle YOLO11, qui est un prédécesseur du dernier modèle YOLO26, ont montré que la laparoscopic instrument detection en temps réel pouvait fonctionner efficacement même sur des systèmes embarqués.

Fig 3. Détection d'instruments laparoscopiques en temps réel utilisant YOLO (Source)
Le modèle a maintenu une grande précision tout en fonctionnant assez rapidement pour des environnements chirurgicaux en direct. Cela montre comment le deep learning peut soutenir un retour visuel fiable en temps réel pendant les procédures.
Link to this sectionCréer des expériences de détail intelligentes pilotées par YOLO#
Nous nous sommes tous retrouvés devant une étagère de supermarché bondée en essayant de trouver le bon produit. De nombreux articles se ressemblent, les étiquettes sont petites et les produits sont souvent placés au mauvais endroit.
Pour les détaillants, cela rend la visibilité des rayons en temps réel difficile. L'IA visuelle et les modèles de détection d'objets YOLO peuvent aider les systèmes des magasins à comprendre ce qui se trouve réellement sur l'étagère grâce aux flux de caméras et aux flux vidéo en direct. Cela réduit la dépendance aux scans de codes-barres et aux vérifications manuelles, rendant la surveillance des rayons plus précise et réactive.

Fig 4. Détection et segmentation de produits sur les étagères de supermarché avec YOLO26
Avec ce type de précision, les détaillants n'ont plus à dépendre uniquement de vérifications manuelles périodiques. Les rayons peuvent être surveillés en continu via la vidéo en direct.
Les faibles niveaux de stock peuvent être signalés immédiatement, les produits mal placés peuvent être repérés plus rapidement et les processus de paiement peuvent se dérouler plus facilement. Cela donne aux détaillants un meilleur contrôle opérationnel tout en créant une expérience d'achat plus fluide pour les clients.
Link to this sectionIA visuelle et navigation autonome#
Les systèmes autonomes peuvent être très efficaces, mais ils s'appuient souvent sur des itinéraires fixes ou des coordonnées prédéfinies. Bien que cela fonctionne dans des environnements stables, les conditions réelles changent rarement.
Les solutions d'IA visuelle, alimentées par des modèles de deep learning, permettent aux machines de comprendre leur environnement et de s'ajuster en temps réel. Avec la computer vision combinée à des algorithmes adaptatifs, les systèmes peuvent réagir aux changements au moment où ils se produisent au lieu de s'appuyer sur des instructions rigides préprogrammées.
Alors, comment cela fonctionne-t-il dans des environnements réels ? Prenons l'exemple d'un robot opérant dans un entrepôt. Les caméras capturent ses environs en continu, et un modèle de vision effectue une détection d'objets en temps réel pour identifier les obstacles, les étagères et les voies de circulation.
Ces détections soutiennent la localisation, aidant le robot à déterminer sa position précise dans l'installation. Sur la base de cet apport visuel, des algorithmes d'optimisation ajustent son itinéraire instantanément, lui permettant de naviguer efficacement et de maintenir une automatisation fluide même lorsque les conditions changent.
Link to this sectionSurveillance des infrastructures et détection de défauts plus intelligente#
Les lignes électriques et les équipements de réseau nécessitent une inspection régulière pour rester sûrs et fiables. La plupart du temps, ces utility inspections impliquent encore des vérifications manuelles, qui prennent du temps et sont difficiles à gérer dans des zones vastes ou reculées.
L'IA visuelle offre un moyen plus simple de garder un œil sur l'infrastructure sans dépendre uniquement des visites de site planifiées. Des modèles comme YOLO26 peuvent détecter les défauts sur les isolateurs de lignes électriques, notamment les fissures, la corrosion ou les dommages visibles, directement à partir d'images capturées dans des conditions extérieures réelles.
En analysant les données visuelles en temps réel, de tels systèmes peuvent signaler des problèmes potentiels qui passeraient autrement inaperçus. L'identification précoce de ces problèmes réduit le risque de panne d'équipement, minimise les pannes inattendues et soutient des opérations de maintenance plus proactives.
Link to this sectionMesurer le retour sur investissement des produits intelligents basés sur la vision#
Pour les dirigeants d'entreprise, l'IA visuelle ne concerne pas seulement la performance technique. Il s'agit d'un impact commercial mesurable.
Lorsqu'ils sont mis en œuvre de manière réfléchie, les systèmes axés sur la vision peuvent améliorer l'efficacité, réduire les coûts et augmenter la précision. Ces gains contribuent également à de meilleures expériences utilisateur et à une performance globale plus forte.
Voici quelques domaines où cet impact devient clair :
- Effort manuel réduit : Les systèmes de vision automatisent les tâches répétitives d'inspection, de surveillance et de vérification, réduisant la dépendance aux processus manuels et libérant les équipes pour se concentrer sur un travail plus stratégique.
- Cycles de décision plus rapides : L'analyse visuelle en temps réel permet aux systèmes de détecter des problèmes ou de déclencher des actions instantanément, raccourcissant les temps de réponse et assurant le bon fonctionnement des opérations.
- Moins d'erreurs opérationnelles : La détection automatisée apporte de la cohérence. En réduisant la supervision humaine dans les tâches de routine, les organisations constatent souvent moins d'erreurs et des résultats plus fiables.
- Engagement utilisateur amélioré : Les produits capables de voir et de réagir intelligemment semblent plus interactifs et pertinents. Cela conduit à une confiance plus forte de l'utilisateur, de meilleures expériences et une adoption plus élevée à long terme.
Link to this sectionPoints clés#
L'IA visuelle permet aux produits d'interpréter des informations visuelles en temps réel, soutenant une automatisation plus intelligente et des expériences plus réactives. Avec des capacités telles que la détection, le suivi et la segmentation, les systèmes dépassent les règles de base pour prendre des décisions contextuelles. Des modèles efficaces tels qu'Ultralytics YOLO26 rendent pratique la construction de produits axés sur la vision évolutifs et compétitifs.
Rejoins notre community active et découvre des innovations telles que l'AI in manufacturing et la vision AI in retail. Visite notre GitHub repository et commence avec la computer vision dès aujourd'hui en consultant nos licensing options.






