Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024
Glossaire

Vision par ordinateur (CV)

Libérez le potentiel de l'IA avec la vision par ordinateur ! Découvrez son rôle dans la détection d'objets, la santé, les voitures autonomes, et bien plus encore. Apprenez-en davantage dès maintenant !

La vision par ordinateur (CV) est un domaine de l'intelligence artificielle (IA) qui forme les ordinateurs à interpréter et à comprendre le monde visuel. En utilisant des images numériques provenant de caméras, de vidéos et de modèles d'apprentissage profond, les machines peuvent identifier et classer avec précision des objets, puis réagir à ce qu'elles "voient". L'objectif est de permettre aux ordinateurs de reproduire la vision humaine, une tâche qui implique le traitement et l'analyse de vastes quantités de données visuelles pour leur donner un sens. En tant que domaine, elle a connu une croissance rapide grâce aux progrès de l'apprentissage profond et à la disponibilité de grands ensembles de données.

Comment fonctionne la vision par ordinateur

La vision par ordinateur fonctionne en appliquant des algorithmes d'apprentissage automatique (ML) aux données visuelles. Au lieu d'être explicitement programmé pour reconnaître un objet, un modèle de CV apprend à identifier des motifs à partir de milliers ou de millions d'images étiquetées. Par exemple, pour entraîner un modèle à reconnaître les chats, il serait alimenté par d'innombrables images de chats jusqu'à ce qu'il puisse apprendre à distinguer les caractéristiques d'un chat par lui-même.

La vision par ordinateur moderne repose fortement sur les modèles d'apprentissage profond, en particulier les réseaux neuronaux convolutifs (CNN). Un CNN est un type de réseau neuronal très efficace pour traiter les données d'image. Il fonctionne en appliquant des filtres (ou noyaux) à une image pour créer des cartes de caractéristiques qui mettent en évidence les caractéristiques importantes comme les arêtes, les textures et les formes. Ces réseaux alimentent de nombreuses tâches de vision par ordinateur courantes, permettant aux machines d'analyser les informations visuelles avec une précision croissante.

Vision par ordinateur vs. Traitement d'image

Bien qu'étroitement liées, la vision par ordinateur et le traitement d'images ne sont pas la même chose. Le traitement d'images est un sous-ensemble de la CV qui se concentre sur la manipulation d'images numériques pour les améliorer ou en extraire des informations utiles. Il implique des opérations telles que l'accentuation, le floutage ou le filtrage d'une image. En revanche, la vision par ordinateur va plus loin en visant à interpréter et à comprendre le contenu de l'image. Par exemple, le traitement d'images peut être utilisé pour améliorer la qualité d'une photo, tandis que la vision par ordinateur serait utilisée pour identifier les personnes, les objets et la scène dans cette photo. Vous pouvez en apprendre davantage sur la distinction dans cet aperçu détaillé du traitement numérique des images.

Tâches clés de la vision par ordinateur

La vision par ordinateur englobe plusieurs tâches clés qui permettent aux machines d'analyser et d'interpréter les données visuelles :

  • Détection d'objets: Cela implique l'identification et la localisation d'objets dans une image ou une vidéo. Un modèle comme Ultralytics YOLO trace une boîte englobante autour de chaque objet détecté et lui attribue une étiquette de classe.
  • Classification d'images : Cette tâche consiste à attribuer une seule étiquette à une image entière à partir d'un ensemble prédéfini de catégories. Par exemple, classer une image comme contenant un « chat » ou un « chien ».
  • Segmentation d'images : Contrairement à la détection d'objets, la segmentation classifie chaque pixel d'une image. Elle fournit une compréhension beaucoup plus détaillée du contenu de l'image. Les sous-tâches comprennent la segmentation d'instance et la segmentation sémantique.
  • Estimation de pose : Ceci est utilisé pour déterminer la position et l'orientation d'une personne ou d'un objet dans l'espace. Il est largement utilisé dans la robotique, la réalité augmentée et l'analyse de l'activité humaine.
  • Suivi d'objets: Cette tâche consiste à suivre un ou plusieurs objets au fil du temps dans une séquence vidéo. Elle est essentielle pour les applications telles que la surveillance et la navigation autonome.

Applications concrètes

Les applications de vision par ordinateur sont de plus en plus répandues dans divers secteurs :

  • Véhicules autonomes : La vision par ordinateur est essentielle pour les voitures autonomes, leur permettant de percevoir leur environnement, de détecter les piétons et les autres véhicules, de lire les panneaux de signalisation et de naviguer en toute sécurité. Des entreprises comme Waymo et Tesla s'appuient fortement sur les systèmes de vision par ordinateur. Découvrez-en davantage sur les solutions d'IA dans le secteur automobile.
  • Santé : Dans l'analyse d'images médicales, la CV aide les radiologues à détecter les anomalies telles que les tumeurs ou les fractures dans les radiographies, les tomodensitométries et les IRM. Elle est également utilisée en chirurgie robotique et pour la surveillance des patients. Pour en savoir plus sur son impact, consultez Radiology: Artificial Intelligence. Vous pouvez également découvrir comment YOLO11 est utilisé pour la détection des tumeurs.
  • Sécurité et surveillance : La vision par ordinateur alimente les systèmes de surveillance automatisés pour détecter les intrusions, suivre les individus et analyser le comportement des foules. Consultez notre guide sur la façon de construire un système d'alarme de sécurité.
  • Vente au détail : Les applications comprennent la gestion des stocks via la surveillance des rayons, l'analyse du comportement des clients et les systèmes de caisse sans caissier comme ceux d'Amazon Go.
  • Fabrication : La vision par ordinateur est utilisée pour le contrôle qualité, la détection des défauts, la surveillance des chaînes de montage et l'automatisation robotique. Découvrez comment créer des solutions de fabrication intelligentes avec YOLO11.
  • Agriculture : Cette technologie permet une agriculture de précision grâce à la surveillance des cultures, la détection des maladies, l'identification des mauvaises herbes et la récolte automatisée. En savoir plus sur la surveillance en temps réel de la santé des cultures.

Outils et frameworks

Le développement et le déploiement de modèles de vision par ordinateur sont facilités par divers outils et frameworks. Les bibliothèques comme PyTorch (visitez le site officiel de PyTorch) et TensorFlow (visitez le site officiel de TensorFlow) sont fondamentales pour la construction de modèles. Les bibliothèques open source comme OpenCV fournissent une vaste collection de fonctions pour la vision par ordinateur en temps réel.

Des plateformes telles que Ultralytics HUB rationalisent l'ensemble du cycle de vie d'un projet CV, de la gestion des ensembles de données et de l'entraînement de modèles personnalisés au déploiement. L'utilisation de formats standardisés comme ONNX contribue également à assurer l'interopérabilité entre les différents frameworks. À mesure que ces technologies mûrissent, elles continueront à stimuler l'innovation dans tous les secteurs.

Rejoignez la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant
Lien copié dans le presse-papiers