Découvrez comment les réseaux neuronaux convolutifs (CNN) alimentent la vision par ordinateur moderne. Apprenez-en davantage sur les couches, les applications et comment exécuter Ultralytics pour une IA en temps réel.
Un réseau neuronal convolutif (CNN) est une architecture d'apprentissage profond spécialisée conçue pour traiter des données avec une topologie de type grille, notamment des images numériques. Inspirés de la structure biologique du cortex visuel, les CNN sont les seuls à pouvoir préserver les relations spatiales au sein des données d'entrée. Contrairement aux réseaux neuronaux traditionnels qui aplatissent une image en une longue liste de chiffres, les CNN analysent de petites régions superposées d'une image pour apprendre automatiquement les hiérarchies de caractéristiques, des simples contours et textures aux formes et objets complexes. Cette capacité en fait la technologie fondamentale des systèmes modernes de vision par ordinateur (CV).
La puissance d'un CNN réside dans sa capacité à réduire une image complexe sous une forme plus facile à traiter sans perdre les caractéristiques essentielles à l'obtention d'une bonne prédiction. Ceci est réalisé grâce à un pipeline de couches distinctes qui transforment le volume d'entrée en une classe ou une valeur de sortie :
Les CNN ont transformé les industries en automatisant les tâches visuelles avec une précision surhumaine .
Alors que les CNN ont longtemps été la norme pour les tâches de vision, une nouvelle architecture appelée Vision Transformer (ViT) a fait son apparition.
Les bibliothèques modernes facilitent l'utilisation des modèles basés sur les CNN. Le ultralytics Le package donne accès
à des modèles de pointe tels que YOLO26, qui intègrent des architectures CNN hautement optimisées pour une inférence rapide.
L'exemple suivant montre comment charger un modèle CNN pré-entraîné et exécuter une prédiction :
from ultralytics import YOLO
# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")
# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the prediction results
results[0].show()
Le développement des CNN est soutenu par un écosystème robuste d'outils open source. Les ingénieurs utilisent généralement des frameworks tels que PyTorch ou TensorFlow pour créer des architectures personnalisées. Ces bibliothèques fournissent les tensor de bas niveau nécessaires à la convolution et à la rétropropagation.
Pour les équipes qui cherchent à rationaliser le cycle de vie des projets de vision par ordinateur, de la collecte de données au déploiement, Ultralytics offre une solution complète. Elle simplifie les flux de travail complexes, permettant aux développeurs de se concentrer sur l'application des CNN pour résoudre les problèmes commerciaux plutôt que sur la gestion de l' infrastructure. De plus, les modèles peuvent être exportés vers des formats tels que ONNX ou TensorRT pour un déploiement haute performance sur des appareils périphériques.
Commencez votre parcours avec l'avenir de l'apprentissage automatique