Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Détection d'objets

Découvrez la puissance de la détection d'objets : identifiez et localisez des objets dans des images ou des vidéos avec des modèles de pointe tels que YOLO. Explorez les applications du monde réel !

La détection d'objets est une capacité essentielle de la vision par ordinateur (VA) qui permet aux systèmes de reconnaître ce qu'une image représente, mais aussi de localiser des exemples spécifiques d'objets dans cette image. Alors que la classification standard attribue une étiquette unique à l'ensemble d'une entrée visuelle, la détection d'objets fournit une compréhension plus granulaire en prédisant une boîte de délimitation autour de chaque objet. plus granulaire en prédisant une boîte englobante autour de chaque autour de chaque entité identifiée, accompagnée d'une étiquette de classe spécifique et d'un score de confiance. score de confiance. Cette technologie sert de base sensorielle sensorielle pour l'intelligence l'intelligence artificielle (IA) avancée, permettant aux machines de percevoir, d'interpréter et d'interagir avec la complexité du monde physique. de percevoir, d'interpréter et d'interagir avec la complexité du monde physique. Du contrôle de qualité automatisé du contrôle automatisé de la qualité dans les usines à la surveillance avancée, elle transforme les données pixellisées non structurées en informations exploitables.

Mécanique de la détection d'objets

Les détecteurs modernes s'appuient principalement sur sur des architectures d'apprentissage profond (DL), en particulier réseaux neuronaux convolutifs (CNN), pour apprendre des hiérarchies spatiales de caractéristiques. Une architecture typique se compose d'un réseau principal, tel que ResNet ou CSPNet, qui extrait les caractéristiques visuelles essentielles de l'image d'entrée. Ces caractéristiques sont ensuite traitées par une tête de détection qui produit les coordonnées des des boîtes de délimitation et la probabilité d'appartenance à une classe.

Pour obtenir des performances élevées, les modèles sont entraînés sur des collections étiquetées massives telles que l'ensemble de données COCO, qui constitue la norme en matière d'évaluation comparative. comme l'ensemble de donnéesCOCO , qui constitue une norme pour l'évaluation des performances. Pendant l'inférence, les algorithmes génèrent souvent plusieurs boîtes qui se chevauchent pour le même objet. Des techniques telles que Suppression Non-Maximale (NMS ) sont sont appliquées pour filtrer ces redondances, en ne conservant que la boîte ayant la plus grande confiance et la meilleure qualité. l'intersection sur l'union (IoU) avec la vérité de terrain. vérité terrain.

Les modèles sont généralement classés en deux catégories :

  • Détecteurs d'objets en deux étapes: Les systèmes tels que Faster R-CNN proposent d'abord des régions d'intérêt, puis classify . Bien qu'historiquement exacts, ils peuvent être coûteux en termes de calcul.
  • Détecteurs d'objets à une étape: Architectures modernes, y compris Ultralytics YOLO11, prédisent les boîtes englobantes et les probabilités de classe en un seul passage. Cette approche est optimisée pour pour l'inférence en temps réel, offrant un idéal entre vitesse et précision. Pour l'avenir, Ultralytics développe actuellement YOLO26, qui vise à affiner l'efficacité de la détection de bout en bout. de bout en bout.

Distinction par rapport aux tâches connexes du CV

Il est essentiel de différencier la détection d'objets des tâches similaires de vision par ordinateur. tâches similaires de vision par ordinateur.

  • Classification d'images: Identifie ce qui se trouve dans une image (par exemple, "chien"), mais pas il se trouve ni combien il y en a.
  • Segmentation d'instance: Comme la détection, elle localise les objets, mais au lieu d'une boîte, elle produit un masque parfait au pixel près décrivant la forme exacte de l'objet. forme exacte de l'objet.
  • Suivi des objets: Il s'agit d'étendre la détection au domaine temporel. détection dans le domaine temporel, en attribuant un identifiant unique aux objets détectés et en suivant leur trajectoire à travers les images vidéo. images vidéo.

Applications concrètes

La détection d'objets est le moteur de nombreuses technologies transformatrices dans divers secteurs.

  • Systèmes autonomes : Dans l'industrie automobile, véhicules autonomes utilisent des modèles de détection pour identifier les piétons, les panneaux de signalisation et les autres voitures en quelques millisecondes. Les leaders dans ce domaine, tels que Waymo et Tesla Autopilot s'appuient sur ces capacités pour naviguer en toute sécurité dans des environnements complexes. sur ces capacités pour naviguer en toute sécurité dans des environnements complexes.
  • Diagnostic médical : Dans l'IA l 'IA dans le domaine de la santé, les modèles de détection radiologues en mettant en évidence les zones d'intérêt sur les radiographies ou les tomodensitogrammes, comme les tumeurs ou les fractures. Des organisations comme les National Institutes of Health (NIH) étudient activement comment l'analyse d'images médicales peut réduire les coûts de santé. l'analyse d'images médicales peut réduire les les erreurs de diagnostic.
  • Analyse du commerce de détail : Les magasins tirent parti de l'IA dans le commerce de détail pour automatiser les processus d'encaissement. l 'IA dans le commerce de détail pour automatiser les processus de surveiller les stocks. Des systèmes similaires à Amazon Go utilisent la détection pour suivre les articles que les clients prennent dans les rayons. détection pour track les articles que les clients prennent dans les rayons.

Exemple de mise en œuvre

L'extrait de code suivant montre comment effectuer une détection d'objet à l'aide d'un modèle YOLO11 pré-entraîné avec l'option ultralytics de l'entreprise. Ce flux de travail simple charge un modèle et exécute une inférence sur une image pour identifier des objets tels que des bus et des personnes. des objets tels que les bus et les personnes.

from ultralytics import YOLO

# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")

# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results with bounding boxes and labels
results[0].show()

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant