Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Vision par ordinateur (CV)

Libérez le potentiel de l'IA avec la vision par ordinateur ! Découvrez son rôle dans la détection d'objets, la santé, les voitures autonomes, et bien plus encore. Apprenez-en davantage dès maintenant !

La vision par ordinateur (VA) est un domaine transformateur de l'intelligence artificielle (IA). l'intelligence artificielle (IA) qui qui permet aux ordinateurs de percevoir, d'interpréter et de comprendre le monde visuel. En traitant les images numériques, les vidéos et d'autres données visuelles, les machines peuvent extraire des informations significatives et prendre des mesures ou formuler des recommandations sur la base de cette analyse. l'analyse. Alors que la vision humaine repose sur l'œil et le cerveau pour contextualiser instantanément l'environnement, la vision par ordinateur utilise des logiciels avancés et des algorithmes des algorithmes d'apprentissage automatique pour reproduire cette Cette capacité permet aux systèmes d'automatiser des tâches qui nécessitaient auparavant la vue humaine.

Comment fonctionne la vision par ordinateur

À la base, la vision par ordinateur repose sur des techniques de reconnaissance des formes pour comprendre les images visuelles. sur des techniques de reconnaissance des formes pour visuelles. Les premières tentatives consistaient à coder manuellement des règles pour définir les objets. l 'apprentissage profond (DL) et de vastes quantités de données données d'entraînement. L'architecture la plus couramment utilisée aujourd'hui est le réseau neuronal convolutif (CNN), qui traite les images pixel par pixel. Ces réseaux identifient des caractéristiques de bas niveau telles que les bords et les textures dans les couches initiales et les combinent pour reconnaître des images complexes. Ces réseaux identifient des caractéristiques de bas niveau comme les bords et les textures dans les couches initiales et les combinent pour reconnaître des concepts complexes, tels que des visages ou des véhicules, dans des couches plus profondes. Ce processus Ce processus nécessite des ensembles massifs de données étiquetées pour apprendre au modèle à distinguer efficacement les différentes catégories. de faire la distinction entre différentes catégories de manière efficace.

Tâches principales en vision par ordinateur

La vision par ordinateur n'est pas une action unique, mais un ensemble de tâches spécifiques qui permettent de résoudre différents problèmes :

  • Détection d'objets: Cette tâche consiste à l'identification et la localisation d'objets dans une image ou un flux vidéo. Elle dessine autour des objets détectés et leur attribue une étiquette de une étiquette de classe, telle que "personne" ou "bicyclette".
  • Classification des images: Le système analyse une image entière et lui attribue une étiquette unique en fonction de son contenu dominant. Par exemple, la classification d'une photo comme "paysage" ou "portrait", classer une photo en "paysage" ou en "portrait".
  • Segmentation des instances: Allant plus loin que la détection, elle identifie le contour précis de chaque objet, en séparant les instances individuelles. détection, elle identifie le contour précis de chaque objet, en séparant les instances individuelles de la même classe de l'arrière-plan. de la même classe de l'arrière-plan.
  • Estimation de la pose: Cette technique détecte points clés spécifiques sur une figure, tels que les articulations d'un corps humain, afin de track mouvement et la posture en temps réel.

Vision par ordinateur vs. Traitement d'image

Il est courant de confondre la vision par ordinateur et le traitement numérique de l'image, mais ils ont des objectifs différents. Le traitement d'images se concentre sur la manipulation d'une image d'entrée pour améliorer sa qualité ou extraire des informations sans nécessairement la "comprendre". ou extraire des informations sans nécessairement la "comprendre". Les exemples les plus courants sont l'ajustement de la luminosité, l'application de filtres ou la réduction du bruit, l'application de filtres ou la réduction du bruit. À l'inverse, la CV se concentre sur la compréhension de l'image, CV se concentre sur la compréhension de l'image, l'objectif étant d'émuler la cognition humaine pour interpréter ce que l'image représente.

Applications concrètes

L'utilité de la vision par ordinateur s'étend à pratiquement tous les secteurs d'activité, favorisant l'efficacité et la sécurité :

Mise en œuvre de la vision par ordinateur avec YOLO11

Les développeurs peuvent mettre en œuvre de puissantes tâches de vision par ordinateur à l'aide du logiciel ultralytics Python . L'exemple ci-dessous montre comment charger le paquet Modèle YOLO11-la dernière version stable recommandée pour tous les cas d'utilisation standard- pour détecter des objets dans une image. version stable recommandée pour tous les cas d'utilisation standard, afin de detect objets dans une image.

from ultralytics import YOLO

# Load the pretrained YOLO11 model (nano version for speed)
model = YOLO("yolo11n.pt")

# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results to see bounding boxes and labels
results[0].show()

Outils et bibliothèques clés

L'écosystème CV est soutenu par de solides bibliothèques à code source ouvert. OpenCV est une bibliothèque fondamentale qui fournit des milliers d'algorithmes pour la vision par ordinateur en temps réel. vision par ordinateur en temps réel. Pour la construction et l'entraînement de modèles d'apprentissage profond, des frameworks tels que PyTorch et TensorFlow sont des de l'industrie. Ultralytics s'appuie sur ces fondations pour fournir des modèles de pointe faciles à déployer. Pour l'avenir, la Ultralytics Platform offre un environnement environnement complet pour gérer l'ensemble du cycle de vie de Vision AI, de la gestion des données au déploiement.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant