Glossaire

Détecteurs d'objets à un étage

Découvrez la rapidité et l'efficacité des détecteurs d'objets à un étage comme YOLO, idéaux pour les applications en temps réel telles que la robotique et la surveillance.

Dans le domaine de la vision par ordinateur (VA), en particulier pour la détection d'objets, la vitesse et l'efficacité sont souvent aussi cruciales que la précision. Les détecteurs d'objets en une étape sont une classe de modèles d'apprentissage profond conçus avec ces priorités à l'esprit, offrant une approche simplifiée pour identifier et localiser des objets dans des images ou des vidéos. Contrairement à leurs homologues à deux étapes, les détecteurs à une étape effectuent la localisation des objets (détermination de l'emplacement d' un objet) et la classification (détermination de ce qu'est un objet) en une seule passe avant du réseau neuronal. Cette conception les rend nettement plus rapides et très adaptés aux applications d'inférence en temps réel.

Principes fondamentaux des détecteurs à un étage

Les détecteurs d'objets en une étape se caractérisent par leur conception de bout en bout, qui évite une étape distincte, gourmande en ressources informatiques, pour proposer des régions d'intérêt (zones susceptibles de contenir des objets). Ils traitent la détection d'objets comme un problème de régression. Le modèle traite l'ensemble de l'image d'entrée une seule fois, en utilisant généralement un réseau dorsal (souvent un réseau neuronal convolutif ou CNN) pour l'extraction des caractéristiques. Ces caractéristiques sont ensuite directement introduites dans une tête de détection qui prédit les coordonnées des boîtes englobantes, les probabilités de classe et les scores de confiance simultanément sur l'ensemble de la grille d'image ou des emplacements de la carte des caractéristiques. Cette architecture à passage unique met l'accent sur la vitesse, ce qui la rend idéale pour les applications où un traitement rapide est essentiel. Parmi les exemples les plus répandus, on peut citer la famille de modèles YOLO d'Ultralytics, connue pour son équilibre entre vitesse et précision (comme YOLO11), et le SSD (Single Shot MultiBox Detector) mis au point par Google Research. De nombreux détecteurs modernes à une étape sont également dépourvus d'ancrage, ce qui simplifie encore le pipeline par rapport aux anciennes méthodes basées sur l'ancrage.

Différences par rapport aux détecteurs à deux étages

La différence fondamentale entre les détecteurs d'objets en une étape et en deux étapes réside dans leur pipeline opérationnel. Les détecteurs en deux étapes, tels que l'influent R-CNN (Region-based CNN) et ses successeurs comme Faster R-CNN, génèrent d'abord de nombreuses propositions de régions à l'aide de méthodes telles que la recherche sélective ou un réseau de propositions de régions (RPN). Dans une deuxième étape distincte, ces propositions sont classées et leurs boîtes de délimitation sont affinées. Ce processus en deux étapes permet généralement d'obtenir une plus grande précision, en particulier pour la détection d'objets de petite taille ou se chevauchant, mais au prix d'une augmentation significative du temps de calcul et d'une diminution de la vitesse d'inférence.

En revanche, les détecteurs à une étape fusionnent ces étapes, effectuant la localisation et la classification simultanément sur l'ensemble de l'image en une seule fois. Cette approche unifiée se traduit par des gains de vitesse substantiels. Historiquement, cet avantage en termes de rapidité impliquait parfois un compromis, conduisant potentiellement à une précision légèrement inférieure à celle des méthodes en deux étapes les plus récentes, en particulier en ce qui concerne la précision de la localisation. Cependant, les progrès réalisés dans la conception de l'architecture, les fonctions de perte et les stratégies d'apprentissage ont permis aux détecteurs modernes à une étape, comme YOLO11, de réduire considérablement cet écart de performance, offrant des comparaisons convaincantes entre divers points de référence. Les performances sont généralement évaluées à l'aide de mesures telles que la précision moyenne (mAP) et l'intersection sur l'union (IoU).

Applications dans le monde réel

La vitesse et l'efficacité des détecteurs d'objets en une étape les rendent inestimables dans de nombreux scénarios du monde réel nécessitant une prise de décision et un traitement rapides :

  • Véhicules autonomes: Permettre aux voitures autonomes de détecter les piétons, les autres véhicules, les feux de signalisation et les obstacles en temps réel pour une navigation sûre. Des entreprises comme Waymo s'appuient fortement sur une détection efficace des objets. Ultralytics fournit des solutions pour l'IA dans l'automobile.
  • Sécurité et surveillance: Alimentation de systèmes de surveillance en temps réel pour détecter les intrusions, identifier les personnes non autorisées, surveiller la densité de la foule ou déclencher des alarmes de sécurité. Cela inclut des applications telles que la prévention des vols.
  • Robotique: Permettre aux robots de percevoir et d'interagir avec leur environnement, ce qui est essentiel pour des tâches telles que la navigation, la manipulation d'objets et la collaboration homme-robot. Découvrez comment les modèles YOLO s'intègrent aux applications robotiques.
  • Gestion du trafic: L'analyse des flux vidéo provenant des caméras de circulation permet de contrôler le flux de véhicules, de détecter les accidents et d'optimiser les horaires des feux de signalisation.
  • Analyse de la vente au détail: Utilisé pour la gestion des stocks, l'analyse du comportement des clients et l'amélioration de l'expérience en magasin.
  • Contrôle de la qualité de la fabrication: Identifier les défauts ou les anomalies sur les lignes de production à grande vitesse.

Outils et formation

Le développement et le déploiement de détecteurs d'objets en une étape impliquent l'utilisation de divers outils et plateformes. Les cadres d'apprentissage profond tels que PyTorch et TensorFlow fournissent les bibliothèques de base. Les bibliothèques de vision artificielle comme OpenCV offrent des fonctions essentielles de traitement d'image. Ultralytics fournit les modèles de pointe Ultralytics YOLO et la plateforme Ultralytics HUB, qui simplifie l'entraînement de modèles personnalisés sur des ensembles de données comme COCO ou vos propres données, la gestion des expériences et le déploiement efficace des modèles. Un entraînement efficace des modèles nécessite souvent un réglage minutieux des hyperparamètres et des stratégies telles que l'augmentation des données pour améliorer la robustesse et la généralisation. Les modèles peuvent être exportés dans des formats tels que ONNX pour être déployés sur différentes plateformes matérielles, y compris les appareils périphériques.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers