Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Reconnaissance d'image

Découvrez comment la reconnaissance d'images permet à l'IA de classify et de comprendre les éléments visuels, ce qui favorise l'innovation dans les domaines de la santé, de la vente au détail, de la sécurité, etc.

La reconnaissance d'images est une technologie essentielle dans le domaine plus large de la vision par ordinateur. vision par ordinateur (VA) qui permet aux logiciels d'identifier d'identifier des objets, des personnes, des lieux et des écritures dans des images. Cette technologie permet aux ordinateurs de "voir" et d'interpréter les données visuelles d'une manière qui imite la perception humaine. de "voir" et d'interpréter des données visuelles d'une manière qui imite la perception humaine. En analysant le contenu en pixels des images numériques ou des trames vidéo, algorithmes d'apprentissage automatique peuvent extraire des des modèles significatifs et attribuer des concepts de haut niveau aux données visuelles. Cette capacité est à la base de l'intelligence l'intelligence artificielle (IA) moderne, permettant d'automatiser des tâches qui nécessitaient auparavant l'œil et la compréhension de l'homme.

Technologies et mécanismes de base

Les systèmes modernes de reconnaissance d'images reposent principalement sur sur des architectures d'apprentissage profond (DL). Plus précisément, réseaux neuronaux convolutifs (CNN) sont devenus la norme dans l'industrie en raison de leur capacité à préserver les relations spatiales dans les données. Ces réseaux traitent les images à travers des couches de filtres mathématiques, en effectuant l 'extraction de caractéristiques pour identifier des formes simples, comme les bords et les textures, avant de les combiner. comme les bords et les textures, avant de les combiner pour reconnaître des entités complexes comme des visages ou des véhicules.

Pour fonctionner efficacement, ces modèles nécessitent de nombreuses données d'entraînement. De vastes collections de photos étiquetées, telles que le célèbre ensemble de données ImageNet, permettent au modèle d'apprendre les caractéristiques statistiques de l'image, comme le célèbre ensemble de donnéesImageNet , permettent au modèle d'apprendre la probabilité statistique qu'un arrangement spécifique de pixels corresponde à une classe spécifique, telle qu'un "Golden Retriever" ou un "feu de circulation". Retriever" ou un "feu de circulation".

Distinguer la reconnaissance d'images des termes apparentés

Bien qu'ils soient souvent utilisés de manière interchangeable avec d'autres termes, il est important pour les développeurs d'en identifier les nuances :

  • Reconnaissance d'images vs. Classification d'images: La classification est une tâche secondaire spécifique dont l'objectif est d'attribuer une étiquette unique à l'ensemble d'une image (par exemple : "Il s'agit d'une photo de plage"), "Il s'agit d'une photo de plage"). La reconnaissance est un terme plus général qui englobe la classification.
  • Reconnaissance d'images vs. Détection d'objets: La détection permet d'aller plus loin dans la reconnaissance. Alors que la reconnaissance identifie ce qui se trouve dans l'image, la détection d'objet la détection d'objets identifie l'endroit où il se trouve en dessinant une en dessinant une boîte de délimitation autour d'instances spécifiques.
  • Reconnaissance d'images vs. Reconnaissance optique de caractères (OCR): La ROC est une forme spécialisée de reconnaissance qui se concentre strictement sur l'identification des caractères de texte et leur conversion en chaînes numériques. chaînes de caractères numériques.

Applications concrètes

L'utilité de la reconnaissance d'images s'étend à pratiquement tous les secteurs. Dans le domaine dans le domaine de la santé, les algorithmes radiologues en reconnaissant automatiquement les anomalies dans les radiographies et les IRM, ce qui permet de diagnostiquer plus rapidement des affections telles que la pneumonie ou les tumeurs. pneumonie ou les tumeurs. Cela relève du domaine spécialisé de l'analyse d'images médicales. l 'analyse d'images médicales.

Un autre cas d'utilisation important est celui de l'industrie automobile, en particulier pour les véhicules autonomes. véhicules autonomes. Les voitures auto-conduites utilisent des algorithmes d'identification pour reconnaître le marquage des voies, lire les panneaux de limitation de vitesse algorithmes d'identification pour reconnaître les marquages de voie, lire les panneaux de limitation de vitesse et detect piétons en temps réel afin de prendre des décisions cruciales pour la sécurité. pour prendre des décisions critiques en matière de sécurité. De même, dans les dans les environnements de vente au détail intelligents, les systèmes faciliter le passage en caisse sans caissier en identifiant les produits au fur et à mesure que les clients les prennent dans les rayons.

Implémentation de la reconnaissance d'images avec YOLO11

Les développeurs peuvent facilement mettre en œuvre des capacités de reconnaissance en utilisant des modèles de pointe tels que YOLO11. Si YOLO est réputé pour sa capacité de détection, il prend également en charge les tâches de classification à grande vitesse. les tâches de classification à grande vitesse. Les outils suivants Python suivant montre comment charger un modèle pré-entraîné et identifier le sujet principal d'une image. charger un modèle pré-entraîné et identifier le sujet principal d'une image.

from ultralytics import YOLO

# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Perform inference on an external image URL
# The model will identify the most likely class (e.g., 'sportscar')
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top predicted class name
print(f"Top Prediction: {results[0].names[results[0].probs.top1]}")

Tendances futures

Au fur et à mesure que le matériel s'améliore, le domaine s'oriente vers l'IA périphérique, où la reconnaissance s'effectue directement sur des appareils tels que les smartphones et les caméras, plutôt que dans le nuage. Cette évolution réduit la latence et améliore la protection de la vie privée. En outre, les progrès en matière de quantification des modèles rendent ces puissants outils puissants outils suffisamment légers pour fonctionner sur des microcontrôleurs, ce qui élargit l'horizon des applications IoT. l'horizon des applications de l'IdO.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant