Découvrez la puissance de la détection d'objets : identifiez et localisez des objets dans des images ou des vidéos avec des modèles de pointe tels que YOLO. Explorez les applications du monde réel !
La détection d'objets est une capacité essentielle de la vision par ordinateur (VA) qui permet aux systèmes de reconnaître ce qu'une image représente, mais aussi de localiser des exemples spécifiques d'objets dans cette image. Alors que la classification standard attribue une étiquette unique à l'ensemble d'une entrée visuelle, la détection d'objets fournit une compréhension plus granulaire en prédisant une boîte de délimitation autour de chaque objet. plus granulaire en prédisant une boîte englobante autour de chaque autour de chaque entité identifiée, accompagnée d'une étiquette de classe spécifique et d'un score de confiance. score de confiance. Cette technologie sert de base sensorielle sensorielle pour l'intelligence l'intelligence artificielle (IA) avancée, permettant aux machines de percevoir, d'interpréter et d'interagir avec la complexité du monde physique. de percevoir, d'interpréter et d'interagir avec la complexité du monde physique. Du contrôle de qualité automatisé du contrôle automatisé de la qualité dans les usines à la surveillance avancée, elle transforme les données pixellisées non structurées en informations exploitables.
Les détecteurs modernes s'appuient principalement sur sur des architectures d'apprentissage profond (DL), en particulier réseaux neuronaux convolutifs (CNN), pour apprendre des hiérarchies spatiales de caractéristiques. Une architecture typique se compose d'un réseau principal, tel que ResNet ou CSPNet, qui extrait les caractéristiques visuelles essentielles de l'image d'entrée. Ces caractéristiques sont ensuite traitées par une tête de détection qui produit les coordonnées des des boîtes de délimitation et la probabilité d'appartenance à une classe.
Pour obtenir des performances élevées, les modèles sont entraînés sur des collections étiquetées massives telles que l'ensemble de données COCO, qui constitue la norme en matière d'évaluation comparative. comme l'ensemble de donnéesCOCO , qui constitue une norme pour l'évaluation des performances. Pendant l'inférence, les algorithmes génèrent souvent plusieurs boîtes qui se chevauchent pour le même objet. Des techniques telles que Suppression Non-Maximale (NMS ) sont sont appliquées pour filtrer ces redondances, en ne conservant que la boîte ayant la plus grande confiance et la meilleure qualité. l'intersection sur l'union (IoU) avec la vérité de terrain. vérité terrain.
Les modèles sont généralement classés en deux catégories :
Il est essentiel de différencier la détection d'objets des tâches similaires de vision par ordinateur. tâches similaires de vision par ordinateur.
La détection d'objets est le moteur de nombreuses technologies transformatrices dans divers secteurs.
L'extrait de code suivant montre comment effectuer une détection d'objet à l'aide d'un modèle YOLO11 pré-entraîné avec l'option
ultralytics de l'entreprise. Ce flux de travail simple charge un modèle et exécute une inférence sur une image pour identifier des objets tels que des bus et des personnes.
des objets tels que les bus et les personnes.
from ultralytics import YOLO
# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")
# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes and labels
results[0].show()