Libérez le potentiel de l'IA avec la vision par ordinateur ! Découvrez son rôle dans la détection d'objets, la santé, les voitures autonomes, et bien plus encore. Apprenez-en davantage dès maintenant !
La vision par ordinateur (VA) est un domaine transformateur de l'intelligence artificielle (IA). l'intelligence artificielle (IA) qui qui permet aux ordinateurs de percevoir, d'interpréter et de comprendre le monde visuel. En traitant les images numériques, les vidéos et d'autres données visuelles, les machines peuvent extraire des informations significatives et prendre des mesures ou formuler des recommandations sur la base de cette analyse. l'analyse. Alors que la vision humaine repose sur l'œil et le cerveau pour contextualiser instantanément l'environnement, la vision par ordinateur utilise des logiciels avancés et des algorithmes des algorithmes d'apprentissage automatique pour reproduire cette Cette capacité permet aux systèmes d'automatiser des tâches qui nécessitaient auparavant la vue humaine.
À la base, la vision par ordinateur repose sur des techniques de reconnaissance des formes pour comprendre les images visuelles. sur des techniques de reconnaissance des formes pour visuelles. Les premières tentatives consistaient à coder manuellement des règles pour définir les objets. l 'apprentissage profond (DL) et de vastes quantités de données données d'entraînement. L'architecture la plus couramment utilisée aujourd'hui est le réseau neuronal convolutif (CNN), qui traite les images pixel par pixel. Ces réseaux identifient des caractéristiques de bas niveau telles que les bords et les textures dans les couches initiales et les combinent pour reconnaître des images complexes. Ces réseaux identifient des caractéristiques de bas niveau comme les bords et les textures dans les couches initiales et les combinent pour reconnaître des concepts complexes, tels que des visages ou des véhicules, dans des couches plus profondes. Ce processus Ce processus nécessite des ensembles massifs de données étiquetées pour apprendre au modèle à distinguer efficacement les différentes catégories. de faire la distinction entre différentes catégories de manière efficace.
La vision par ordinateur n'est pas une action unique, mais un ensemble de tâches spécifiques qui permettent de résoudre différents problèmes :
Il est courant de confondre la vision par ordinateur et le traitement numérique de l'image, mais ils ont des objectifs différents. Le traitement d'images se concentre sur la manipulation d'une image d'entrée pour améliorer sa qualité ou extraire des informations sans nécessairement la "comprendre". ou extraire des informations sans nécessairement la "comprendre". Les exemples les plus courants sont l'ajustement de la luminosité, l'application de filtres ou la réduction du bruit, l'application de filtres ou la réduction du bruit. À l'inverse, la CV se concentre sur la compréhension de l'image, CV se concentre sur la compréhension de l'image, l'objectif étant d'émuler la cognition humaine pour interpréter ce que l'image représente.
L'utilité de la vision par ordinateur s'étend à pratiquement tous les secteurs d'activité, favorisant l'efficacité et la sécurité :
Les développeurs peuvent mettre en œuvre de puissantes tâches de vision par ordinateur à l'aide du logiciel ultralytics Python . L'exemple
ci-dessous montre comment charger le paquet Modèle YOLO11-la dernière version stable recommandée pour tous les cas d'utilisation standard- pour détecter des objets dans une image.
version stable recommandée pour tous les cas d'utilisation standard, afin de detect objets dans une image.
from ultralytics import YOLO
# Load the pretrained YOLO11 model (nano version for speed)
model = YOLO("yolo11n.pt")
# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results to see bounding boxes and labels
results[0].show()
L'écosystème CV est soutenu par de solides bibliothèques à code source ouvert. OpenCV est une bibliothèque fondamentale qui fournit des milliers d'algorithmes pour la vision par ordinateur en temps réel. vision par ordinateur en temps réel. Pour la construction et l'entraînement de modèles d'apprentissage profond, des frameworks tels que PyTorch et TensorFlow sont des de l'industrie. Ultralytics s'appuie sur ces fondations pour fournir des modèles de pointe faciles à déployer. Pour l'avenir, la Ultralytics Platform offre un environnement environnement complet pour gérer l'ensemble du cycle de vie de Vision AI, de la gestion des données au déploiement.