Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
IA de vision

Un aperçu rapide de la vision par IA et de son fonctionnement

Explore comment la vision par IA transforme les images et les vidéos en informations en temps réel en utilisant des modèles, des jeux de données et des flux de travail de bout en bout de pointe à travers les industries.

ABAbirami Vina
4 min read
La vision par IA détectant des objets dans des données visuelles réelles

Chaque jour, les caméras dans les usines, les hôpitaux, les villes, les véhicules et les appareils grand public capturent d'énormes quantités d'images et de vidéos. Ce flux constant de données visuelles crée de nouvelles possibilités, mais il rend également difficile la compréhension de ce qui se passe pour agir rapidement.

Par exemple, les intersections très fréquentées ou les espaces publics bondés peuvent changer d'un instant à l'autre. La surveillance manuelle de ces environnements est lente et souvent imprécise, surtout lorsque des décisions rapides et fiables sont nécessaires.

Pour gérer de telles situations, les systèmes ont besoin d'un moyen de comprendre les informations visuelles au moment où elles apparaissent et d'y répondre en temps réel. La vision par ordinateur rend cela possible en permettant aux machines d'analyser des images et des vidéos, de reconnaître des motifs et d'extraire des informations utiles.

Les anciens systèmes de vision par ordinateur dépendaient de règles fixes, qui fonctionnaient dans des environnements contrôlés mais échouaient souvent lorsque les conditions, comme l'éclairage ou l'angle des caméras, changeaient. La vision par IA moderne améliore cette approche en utilisant l'intelligence artificielle et l'apprentissage automatique.

Au lieu de simplement capturer ou stocker des visuels, ces systèmes analysent les données visuelles en temps réel, apprennent à partir d'exemples et s'adaptent aux environnements changeants. Cela rend la vision par IA plus efficace dans les situations réelles et lui permet de s'améliorer au fil du temps à mesure qu'elle est utilisée dans davantage d'applications.

Dans cet article, nous examinerons de plus près ce qu'est la vision par IA et comment elle peut être utilisée pour créer des flux de travail intelligents de bout en bout. Commençons !

Link to this sectionQu'est-ce que la vision par IA ?#

La vision par IA est une branche de l'intelligence artificielle qui permet aux machines de comprendre et d'interpréter les images et les vidéos. En d'autres termes, les systèmes de vision par IA analysent ce qu'ils voient et utilisent ces informations pour soutenir des actions, optimiser des prédictions ou prendre des décisions dans le cadre d'un flux de travail plus large. Contrairement à l'IA générative, qui crée du nouveau contenu, la vision par IA se concentre sur la compréhension et l'extraction d'informations à partir de données visuelles existantes.

Par exemple, la surveillance d'une activité sur un site de production ou dans un espace public sur de longues périodes exige une vitesse et une cohérence difficiles à maintenir manuellement. Les systèmes de vision par IA peuvent relever ce défi en appliquant des techniques d'apprentissage automatique et d'apprentissage profond pour reconnaître des motifs, identifier des détails pertinents et réagir à mesure que de nouvelles informations visuelles apparaissent.

IA de vision détectant des objets dans une image

Fig 1. Un exemple d'utilisation de la vision par IA pour détecter des objets dans une image (Source)

Puisque les images et les vidéos sont souvent générées en grands volumes et à haute vitesse, les systèmes de vision par IA peuvent traiter les données visuelles en continu et appliquer les mêmes règles à chaque image. Cela rend les résultats plus cohérents et aide les équipes à améliorer leurs opérations tout en restant précises à mesure que les conditions changent.

Dans une utilisation réelle, la vision par IA fait généralement partie d'un système d'IA de bout en bout. Elle connecte des modèles de vision par IA avec une logique de décision et d'autres outils qui agissent sur les résultats. En transformant les entrées visuelles en informations exploitables, la vision par IA peut automatiser des tâches routinières et favoriser une prise de décision plus rapide et plus confiante dans de nombreuses applications de vision par ordinateur.

Link to this sectionComment fonctionne la vision par IA : passer des données visuelles aux informations exploitables#

Alors, comment un système ou une machine passe-t-il de la vision d'une image ou d'une vidéo à la compréhension de ce qui se passe et à la décision de ce qu'il faut faire ensuite ?

Le processus commence par une entrée visuelle du monde réel, comme des photos, des clips vidéo, des flux de caméra en direct ou des flux de capteurs. Étant donné que la qualité, l'éclairage et l'angle de ces données peuvent varier considérablement, elles doivent généralement être préparées avant l'analyse.

Cette préparation peut inclure le redimensionnement des images, l'ajustement de l'éclairage et l'organisation des trames vidéo dans un format cohérent. Un contexte supplémentaire, comme les horodatages ou l'emplacement de la caméra, est souvent inclus pour soutenir une analyse plus précise.

Les données préparées sont ensuite utilisées dans un cadre d'apprentissage qui permet au système de reconnaître des motifs visuels. En s'entraînant sur des images et des vidéos étiquetées, un modèle de vision par IA apprend à quoi ressemblent les objets, les motifs et les événements dans différentes conditions.

Cette compréhension apprise forme la base de nombreuses tâches courantes de vision par ordinateur telles que la détection d'objets (identifier et localiser des objets dans une image) et la segmentation d'instance (séparer et étiqueter des objets individuels au niveau du pixel). Les modèles de vision par IA de pointe, tels qu'Ultralytics YOLO26, sont conçus pour prendre en charge ces tâches tout en restant rapides et précis dans des environnements réels.

YOLO effectuant une segmentation d'instance sur des objets

Fig 2. Un aperçu de l'utilisation de YOLO pour la segmentation d'instance (Source)

Une fois que le système est déployé, les entrées visuelles sont traitées en continu dans le cadre d'un flux de travail de bout en bout. Le modèle analyse les images et les vidéos et envoie ses sorties vers des tableaux de bord, des outils d'automatisation ou d'autres systèmes d'IA. Dans certains cas, des agents de vision par IA utilisent ces résultats pour déclencher des actions ou soutenir la prise de décision, transformant ainsi la compréhension visuelle en informations pratiques et exploitables.

Link to this sectionL'évolution des modèles et des architectures de vision#

À mesure que tu en apprends davantage sur la vision par IA, tu peux te demander pourquoi les modèles et les architectures sont importants et comment ils affectent les performances du système. Les modèles de vision par IA sont cruciaux pour les innovations actuelles en matière de vision par ordinateur.

La plupart des systèmes de vision par IA sont construits autour d'un modèle qui détermine la manière dont les images et les vidéos sont analysées. Le modèle définit ce que le système peut reconnaître dans une scène et ses performances dans différentes conditions.

À mesure que les applications de vision par IA sont devenues plus variées et complexes, les modèles de vision par IA et leurs architectures sous-jacentes ont continué à évoluer pour suivre la cadence et rester conviviaux. Les premiers systèmes de vision par ordinateur exigeaient des ingénieurs qu'ils définissent manuellement ce que le système devait rechercher, comme des bords, des couleurs ou des formes spécifiques.

Ces approches basées sur des règles fonctionnaient bien dans des environnements contrôlés, mais elles échouaient souvent lorsque l'éclairage changeait, que la qualité de la caméra variait ou que les scènes devenaient plus complexes. Les modèles de vision par IA modernes adoptent une approche différente.

De nombreux modèles open-source apprennent les motifs visuels directement à partir des données, ce qui les rend plus flexibles et mieux adaptés aux environnements réels où les conditions sont imprévisibles. Les avancées dans l'architecture des modèles ont également simplifié la manière dont les images et les vidéos sont traitées, rendant ces systèmes plus faciles à déployer et à intégrer dans des plateformes de vision par IA pratiques.

Les modèles Ultralytics YOLO sont un bon exemple de ce changement. Des modèles tels que YOLO26 sont largement utilisés pour les tâches de détection d'objets qui nécessitent de la vitesse et de la cohérence, en particulier dans les applications de vidéo en direct.

Link to this sectionExplorer les tâches principales de la vision par IA#

Voici quelques-unes des tâches de vision par ordinateur fondamentales sur lesquelles les systèmes de vision pilotés par l'IA s'appuient pour comprendre les informations visuelles et rationaliser les environnements réels :

  • Détection d'objets : Cette tâche permet à un système d'identifier quels objets sont présents dans une image ou une vidéo et de déterminer où ils sont situés, généralement en dessinant des boîtes englobantes autour de chaque objet.
  • Classification d'images : Avec cette approche, une image entière est analysée et se voit attribuer une ou plusieurs étiquettes en fonction de son contenu global, ce qui aide à organiser les visuels et à éclairer les décisions.
  • Segmentation d'instance : Pour les tâches nécessitant une plus grande précision, cette tâche décompose une image au niveau du pixel pour séparer les objets ou les régions au sein d'une scène.
  • Suivi d'objets : Dans les applications basées sur la vidéo, cette capacité permet de suivre des objets à travers les images tout en préservant leur identité et leur mouvement au fil du temps.
  • Estimation de pose : Elle identifie des points clés sur les personnes ou les objets, tels que des articulations ou des points de référence, pour déterminer leur position, leur posture et leur mouvement dans des environnements dynamiques.

Détection et suivi de véhicules sur une route à l'aide de YOLO

Fig 3. Détection et suivi de véhicules utilisant YOLO (Source)

Link to this sectionLe rôle des jeux de données dans la vision par IA#

Derrière chaque système de vision par IA efficace se trouve un jeu de données bien organisé. Ces jeux de données de vision par IA fournissent les images et les vidéos à partir desquelles les modèles de vision par IA apprennent, les aidant à reconnaître des objets, des motifs et des scènes dans des environnements réels.

La qualité des données affecte directement la précision et la fiabilité du système. Pour rendre les données visuelles percutantes, les jeux de données sont annotés. Cela signifie que des détails importants sont ajoutés à chaque image ou vidéo, comme l'étiquetage d'objets, la mise en évidence de zones spécifiques ou l'attribution de catégories.

En plus des étiquettes, des métadonnées supplémentaires comme l'heure, l'emplacement ou le type de scène peuvent être incluses pour aider à organiser les données et améliorer la compréhension. Les jeux de données sont également couramment divisés en ensembles d'entraînement, de validation et de test afin que les systèmes puissent être évalués sur des visuels qu'ils n'ont pas encore vus.

Les jeux de données populaires tels qu'ImageNet, COCO et Open Images ont joué un rôle majeur dans l'avancement de la vision par IA en fournissant de grandes collections diversifiées d'images étiquetées. Pourtant, la collecte de données réelles reste difficile.

Les biais, les lacunes dans la couverture et les environnements en constante évolution rendent difficile la création de jeux de données qui reflètent réellement les conditions réelles. Obtenir le bon équilibre de données à grande échelle est essentiel pour construire des systèmes de vision par IA fiables.

Link to this sectionUn aperçu des divers cas d'utilisation de la vision par IA#

Maintenant que tu as une meilleure compréhension du fonctionnement de la vision par IA, examinons comment elle est utilisée dans des applications réelles. Dans de nombreux secteurs, la vision par IA aide les équipes à gérer des tâches visuelles à grande échelle, ce qui conduit à des réponses plus rapides et à des opérations plus efficaces.

Voici quelques moyens courants par lesquels la vision par IA est utilisée dans différents secteurs :

  • Fabrication : Sur le site de production, la vision par IA peut être utilisée pour surveiller les produits au fur et à mesure qu'ils passent par chaque étape de production. Elle peut repérer les défauts, les pièces manquantes ou les incohérences tôt, aidant ainsi les équipes à réduire les retouches, à maintenir la qualité et à éviter les temps d'arrêt imprévus.
  • Commerce de détail : Dans les espaces de vente, les solutions de vision par IA peuvent suivre les stocks, vérifier l'état des rayons et réduire les pertes. En analysant les visuels en magasin, ces systèmes peuvent faciliter la compréhension par le personnel de ce qui se passe sur le terrain et permettre des ajustements plus rapides pour maintenir le bon fonctionnement des opérations.
  • Santé : La vision par IA peut soutenir les professionnels de la santé en aidant à l'examen d'images médicales, telles que des scans ou des résultats de tests. Elle peut signaler des zones nécessitant une attention plus particulière, permettant aux cliniciens de travailler plus efficacement tout en gardant les décisions finales entre les mains de l'humain.
  • Transport et villes intelligentes : Sur les routes et dans les espaces publics, la vision par IA aide les villes à surveiller la fluidité du trafic, à détecter les incidents et à améliorer la sécurité à un niveau supérieur. L'analyse en temps réel des flux de caméras permet des réponses plus rapides aux conditions changeantes et soutient une meilleure gestion des infrastructures urbaines.

Surveillance automatisée de produits par IA de vision dans la fabrication

Fig 4. Surveillance automatisée des produits utilisant la vision par IA dans la fabrication (Source)

Link to this sectionAvantages et inconvénients des outils de vision par IA#

Voici quelques-uns des principaux avantages de l'utilisation de la vision par IA dans des applications réelles :

  • S'adapte à tous les cas d'utilisation : Une fois entraînés, les systèmes de vision par IA peuvent être déployés sur plusieurs sites ou applications avec des changements minimes.
  • Assistance par IA plus rapide : En analysant les images et les vidéos au moment où elles sont capturées, les systèmes basés sur la vision par IA peuvent fournir des informations en temps réel qui soutiennent des réponses plus rapides et une meilleure prise de décision.
  • S'intègre facilement aux flux de travail existants : Les sorties de la vision par IA peuvent être connectées à des systèmes en aval, des tableaux de bord ou des pipelines d'automatisation.

Malgré ces avantages, il existe des limites qui peuvent affecter les performances des systèmes de vision par IA. Voici quelques facteurs à garder à l'esprit :

  • Dépendance à la qualité et à la disponibilité des données : Les systèmes de vision par IA dépendent fortement de jeux de données volumineux et bien préparés. La collecte et la maintenance de données visuelles de haute qualité peuvent être chronophages et coûteuses.
  • Sensibilité aux changements environnementaux : Les performances peuvent chuter lorsque les caméras bougent, que l'éclairage change ou que les scènes évoluent de manière significative sans réentraînement ou ajustement.
  • Besoins en calcul et en infrastructure : L'exécution de modèles de vision par IA, surtout en temps réel ou à grande échelle, peut nécessiter des ressources de calcul importantes et du matériel spécialisé.

Link to this sectionPoints clés#

La vision par IA transforme les images et les vidéos en informations significatives que les systèmes peuvent comprendre et utiliser. Cela aide à automatiser les tâches visuelles et soutient une prise de décision plus rapide et plus fiable. Son efficacité dépend de la combinaison de modèles performants, de jeux de données de haute qualité et de flux de travail bien conçus travaillant ensemble.

Intéressé par la vision par IA ? Rejoins notre communauté et apprends-en davantage sur la vision par ordinateur dans l'agriculture et la vision par IA dans l'industrie automobile. Découvre nos options de licence pour commencer avec la vision par ordinateur. Visite notre répertoire GitHub pour continuer à explorer l'IA.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique