Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Un guide pour plonger au cœur de la détection d'objets en 2025

Abirami Vina

6 min de lecture

6 février 2025

Découvrez la détection d'objets, son importance dans l'IA et comment des modèles comme YOLO11 transforment des secteurs tels que les voitures autonomes, les soins de santé et la sécurité.

De nombreux secteurs intègrent rapidement des solutions d'intelligence artificielle (IA) dans leurs opérations. Parmi les nombreuses technologies d'IA disponibles aujourd'hui, la vision par ordinateur est l'une des plus populaires. La vision par ordinateur est une branche de l'IA qui aide les ordinateurs à voir et à comprendre le contenu des images et des vidéos, tout comme les humains. Elle permet aux machines de reconnaître des objets, d'identifier des motifs et de comprendre ce qu'elles regardent. 

La valeur du marché mondial de la vision par ordinateur devrait atteindre 175,72 milliards de dollars d'ici 2032. La vision par ordinateur englobe diverses tâches qui permettent aux systèmes de Vision IA d'analyser et d'interpréter des données visuelles. L'une des tâches les plus utilisées et essentielles de la vision par ordinateur est la détection d'objets. 

La détection d'objets se concentre sur la localisation et la classification d'objets dans des données visuelles. Par exemple, si vous montrez à un ordinateur l'image d'une vache, il peut detect la vache et dessiner un cadre autour d'elle. Cette capacité est utile dans des applications réelles telles que la surveillance des animaux, les voitures autonomes et la surveillance. 

Alors, comment peut-on procéder à la détection d'objets ? L'une des méthodes consiste à utiliser des modèles de vision par ordinateur. En voici un exemple, Ultralytics YOLO11 est un modèle de vision par ordinateur qui prend en charge des tâches de vision par ordinateur telles que la détection d'objets. 

Dans ce guide, nous allons explorer la détection d'objets et son fonctionnement. Nous aborderons également quelques applications réelles de la détection d'objets et Ultralytics YOLO11.

__wf_reserved_inherit
Fig. 1. Utilisation de la fonction de détection d'objets de YOLO11pour surveiller le bétail.

Qu'est-ce que la détection d'objets ? 

La détection d'objets est une tâche de vision par ordinateur qui identifie et localise les objets dans des images ou des vidéos. Elle répond à deux questions clés : « Quels objets sont dans l'image ? » et « Où sont-ils situés ? »

La détection d'objets est un processus qui comporte deux étapes clés. La première, la classification des objets, permet au système de reconnaître et d'étiqueter les objets, par exemple en identifiant un chat, une voiture ou une personne sur la base de modèles appris. La seconde, la localisation, détermine la position de l'objet en dessinant une boîte englobante autour de lui, indiquant l'endroit où il apparaît dans l'image. Ensemble, ces étapes permettent aux machines de detect et de comprendre les objets dans une scène.

L'aspect de la détection d'objets qui la rend unique est sa capacité à reconnaître les objets et àLocaliser leur emplacement avec précision. D'autres tâches de vision par ordinateur se concentrent sur différents objectifs.

Par exemple, la classification d'images attribue une étiquette à une image entière. Pendant ce temps, la segmentation d'image fournit une compréhension au niveau des pixels des différents éléments. D'autre part, la détection d'objets combine la reconnaissance avec la localisation. Cela la rend particulièrement utile pour des tâches telles que le comptage de plusieurs objets en temps réel.

__wf_reserved_inherit
Fig 2. Comparaison des tâches de vision par ordinateur.

Reconnaissance d'objets vs. détection d'objets

Lorsque vous explorez divers termes de vision par ordinateur, vous pouvez avoir l'impression que la reconnaissance d'objets et la détection d'objets sont interchangeables - mais elles servent des objectifs différents. Une excellente façon de comprendre la différence est d'examiner la détection de visage et la reconnaissance faciale.

La détection des visages est un type de détection d'objets. Elle identifie la présence d'un visage dans une image et marque son emplacement à l'aide d'une boîte englobante. Elle répond à la question "Où se trouve le visage dans l'image ?". Cette technologie est couramment utilisée dans les caméras de smartphones qui font automatiquement la mise au point sur les visages ou dans les caméras de sécurité qui detect présence d'une personne.

La reconnaissance des visages, en revanche, est une forme de reconnaissance des objets. Elle ne se contente pas de detect un visage ; elle identifie de quel visage il s'agit en analysant des caractéristiques uniques et en les comparant à une base de données. Elle répond à la question "Qui est cette personne ?". C'est la technologie qui permet de déverrouiller votre téléphone avec Face ID ou les systèmes de sécurité des aéroports qui vérifient les identités.

En termes simples, la détection d'objets trouve et localise les objets, tandis que la reconnaissance d'objets les classifie et les identifie. 

__wf_reserved_inherit
Fig 3. Détection d'objets vs reconnaissance d'objets. Image de l'auteur.

De nombreux modèles de détection d'objets, comme YOLO11, sont conçus pour prendre en charge la détection des visages, mais pas la reconnaissance des visages. YOLO11 peut identifier efficacement la présence d'un visage dans une image et dessiner un cadre autour de celui-ci, ce qui le rend utile pour des applications telles que les systèmes de surveillance, le contrôle des foules et l'étiquetage automatisé des photos. Cependant, il ne peut pas déterminer de quel visage il s'agit. YOLO11 peut être intégré à des modèles spécifiquement entraînés pour la reconnaissance des visages, tels que Facenet ou DeepFace, afin de permettre à la fois la détection et l'identification dans un seul système.

Comprendre comment fonctionne la détection d'objets

Avant de discuter du fonctionnement de la détection d'objets, examinons de plus près comment un ordinateur analyse une image. Au lieu de voir une image comme nous le faisons, un ordinateur la décompose en une grille de minuscules carrés appelés pixels. Chaque pixel contient des informations de couleur et de luminosité que les ordinateurs peuvent traiter pour interpréter les données visuelles.

Pour donner un sens à ces pixels, les algorithmes les regroupent en régions significatives en fonction de leur forme, de leur couleur et de leur proximité. Les modèles de détection d'objets, comme YOLO11, peuvent reconnaître des motifs ou des caractéristiques dans ces groupes de pixels. 

Par exemple, une voiture autonome ne voit pas un piéton de la même manière que nous : elle détecte des formes et des motifs qui correspondent aux caractéristiques d'un piéton. Ces modèles reposent sur un entraînement intensif avec des jeux de données d'images étiquetées, ce qui leur permet d'apprendre les caractéristiques distinctives d'objets tels que les voitures, les panneaux de signalisation et les personnes.

Un modèle typique de détection d'objets comporte trois parties principales : le backbone, le neck et la head. Le backbone extrait les caractéristiques importantes d'une image. Le neck traite et affine ces caractéristiques, tandis que la head est chargée de prédire les emplacements des objets et de les classifier.

Affiner les détections et présenter les résultats

Une fois les détections initiales effectuées, des techniques de post-traitement sont appliquées pour améliorer la précision et filtrer les prédictions redondantes. Par exemple, les boîtes englobantes qui se chevauchent sont supprimées, ce qui garantit que seules les détections les plus pertinentes sont conservées. De plus, des scores de confiance (valeurs numériques représentant le degré de certitude du modèle qu'un objet détecté appartient à une certaine classe) sont attribués à chaque objet détecté afin d'indiquer la certitude du modèle quant à ses prédictions.

Enfin, la sortie est présentée avec des boîtes englobantes dessinées autour des objets détectés, ainsi que leurs étiquettes de classe prédites et leurs scores de confiance. Ces résultats peuvent ensuite être utilisés pour des applications concrètes.

Modèles de détection d'objets populaires 

Il existe aujourd'hui de nombreux modèles de vision par ordinateur, dont les plus populaires sont les modèlesYOLO d'Ultralytics . Ils sont réputés pour leur rapidité, leur précision et leur polyvalence. Au fil des ans, ces modèles sont devenus plus rapides, plus précis et capables de traiter un plus grand nombre de tâches. La sortie des modèles Ultralytics YOLOv5 a facilité le déploiement avec des frameworks tels que PyTorch, permettant à un plus grand nombre de personnes d'utiliser l'IA Vision avancée sans avoir besoin d'une expertise technique approfondie.

Construire sur cette base, Ultralytics YOLOv8 a introduit de nouvelles fonctionnalités telles que la segmentation des instances, l'estimation de la pose et la classification des images. Aujourd'hui, YOLO11 va encore plus loin en améliorant les performances dans de multiples tâches. Avec 22 % de paramètres en moins que YOLOv8m, YOLO11m atteint une précision moyenne plus élevéemAP sur l'ensemble de données COCO . En termes simples, YOLO11 peut reconnaître des objets avec une plus grande précision tout en utilisant moins de ressources, ce qui le rend plus rapide et plus fiable.

Que vous soyez un expert en IA ou que vous débutiez, YOLO11 offre une solution puissante et conviviale pour les applications de vision par ordinateur.

Entraînement personnalisé d'un modèle pour la détection d'objets

L'entraînement des modèles d'IA de vision consiste à aider les ordinateurs à reconnaître et à comprendre les images et les vidéos. Cependant, l'entraînement peut être un processus long. Au lieu de partir de zéro, l'apprentissage par transfert accélère les choses en utilisant des modèles pré-entraînés qui reconnaissent déjà des motifs courants.

Par exemple, YOLO11 a déjà été entraîné sur l'ensemble de donnéesCOCO , qui contient un ensemble varié d'objets de la vie quotidienne. Ce modèle pré-entraîné peut être personnalisé pour detect objets spécifiques qui ne figurent pas dans l'ensemble de données d'origine. 

Pour entraîner YOLO11 de manière personnalisée, vous avez besoin d'un ensemble de données étiquetées contenant des images des objets que vous souhaitez detect. Par exemple, si vous souhaitez construire un modèle permettant d'identifier les différents types de fruits dans une épicerie, vous devez créer un ensemble de données contenant des images étiquetées de pommes, de bananes, d'oranges, etc. Une fois l'ensemble de données préparé, YOLO11 peut être entraîné, en ajustant les paramètres tels que la taille du lot, le taux d'apprentissage et les époques afin d'optimiser les performances.

Grâce à cette approche, les entreprises peuvent apprendre à YOLO11 à detect n'importe quoi, qu'il s'agisse de pièces défectueuses dans la fabrication ou d'espèces sauvages dans le cadre de projets de conservation, en adaptant le modèle à leurs besoins exacts.

Applications de la détection d'objets

Ensuite, examinons quelques cas d'utilisation concrets de la détection d'objets et la manière dont elle transforme divers secteurs.

Détection des dangers pour la conduite autonome

Les voitures autonomes utilisent des tâches de vision par ordinateur telles que la détection d'objets pour naviguer en toute sécurité et éviter les obstacles. Cette technologie les aide à reconnaître les piétons, les autres véhicules, les nids-de-poule et les dangers de la route, ce qui leur permet de mieux comprendre leur environnement. Elles peuvent prendre des décisions rapides et se déplacer en toute sécurité dans la circulation en analysant constamment leur environnement.

__wf_reserved_inherit
Fig. 4. Exemple d'utilisation de la détection d'objets pour detect nids-de-poule avec YOLO11.

Analyse d'imagerie médicale dans le secteur de la santé

Les techniques d'imagerie médicale telles que les rayons X, les IRM, les tomodensitogrammes et les ultrasons créent des images très détaillées du corps humain pour aider à diagnostiquer et à traiter les maladies. Ces scanners produisent de grandes quantités de données que les médecins, tels que les radiologues et les pathologistes, doivent soigneusement analyser pour detect maladies. Cependant, l'examen détaillé de chaque image peut prendre beaucoup de temps, et les experts humains peuvent parfois manquer des détails en raison de la fatigue ou de contraintes de temps.

Les modèles de détection d'objets tels que YOLO11 peuvent aider en identifiant automatiquement et avec une grande précision les caractéristiques clés des scanners médicaux, telles que les organes, les tumeurs ou les anomalies. Les modèles formés sur mesure peuvent mettre en évidence les zones préoccupantes à l'aide de boîtes de délimitation, ce qui aide les médecins à se concentrer plus rapidement sur les problèmes potentiels. Cela permet de réduire la charge de travail, d'améliorer l'efficacité et d'obtenir rapidement des informations.

__wf_reserved_inherit
Fig. 5. Analyse d'images médicales à l'aide de YOLO11.

Améliorer la sécurité grâce à la détection de personnes et d'anomalies

Le suivi d'objets est une tâche de vision par ordinateur prise en charge par YOLO11, qui permet une surveillance en temps réel et des améliorations de la sécurité. Elle s'appuie sur la détection d'objets en identifiant les objets et en suivant continuellement leur mouvement à travers les images. Cette technologie est largement utilisée dans les systèmes de surveillance pour améliorer la sécurité dans divers environnements.

Par exemple, dans les écoles et les crèches, le suivi d'objets peut aider à surveiller les enfants et à les empêcher de s'éloigner. Dans les applications de sécurité, il joue un rôle clé dans la détection des intrus dans les zones restreintes, dans la surveillance des foules en cas de surpeuplement ou de comportement suspect, et dans l'envoi d'alertes en temps réel lorsqu'une activité non autorisée est détectée. En suivant track objets pendant qu'ils se déplacent, les systèmes de suivi YOLO11 améliorent la sécurité, automatisent la surveillance et permettent de réagir plus rapidement aux menaces potentielles.

Avantages et inconvénients de la détection d'objets

Voici quelques-uns des principaux avantages que la détection d'objets peut apporter à divers secteurs :

  • Automatisation : La détection d'objets peut aider à réduire le besoin de supervision humaine dans des tâches telles que la surveillance des images de vidéosurveillance.
  • Fonctionne avec d'autres modèles d'IA : Elle peut être intégrée à la reconnaissance faciale, à la reconnaissance d'actions et aux systèmes de suivi pour améliorer la précision et la fonctionnalité.
  • Traitement en temps réel : De nombreux modèles de détection d'objets, comme YOLO11, sont rapides et efficaces, ce qui les rend idéaux pour les applications en temps réel qui nécessitent des résultats instantanés. 

Bien que ces avantages soulignent l'impact de la détection d'objets dans différents cas d'utilisation, il est également important de tenir compte des défis liés à sa mise en œuvre. Voici quelques-uns des principaux défis :

  • Confidentialité des données: L'utilisation de données visuelles, en particulier dans les zones sensibles comme la surveillance ou les soins de santé, peut soulever des problèmes de confidentialité et de sécurité.
  • Occlusion : L'occlusion dans la détection d'objets se produit lorsque les objets sont partiellement bloqués ou cachés de la vue, ce qui rend difficile la detect et la classify précises classify modèle.
  • Coût de calcul élevé : Les modèles à haute performance nécessitent souvent des GPU (processeurs graphiques) puissants pour le traitement, ce qui rend le déploiement en temps réel coûteux.

Principaux points à retenir

La détection d'objets est un outil de vision artificielle qui change la donne et aide les machines à detect et à localiser des objets dans les images et les vidéos. Elle est utilisée dans des secteurs allant des voitures auto-conduites aux soins de santé, rendant les tâches plus faciles, plus sûres et plus efficaces. Avec des modèles plus récents comme YOLO11, les entreprises peuvent facilement créer des modèles de détection d'objets personnalisés pour créer des applications de vision par ordinateur spécialisées. 

Bien qu'il existe certains défis, comme les problèmes de confidentialité et les objets cachés de la vue, la détection d'objets est une technologie fiable. Sa capacité à automatiser les tâches, à traiter les données visuelles en temps réel et à s'intégrer à d'autres outils de Vision IA en fait un élément essentiel des innovations de pointe.

Pour en savoir plus, visitez notre dépôt GitHub et participez à la vie de notre communauté. Explorez les innovations dans des secteurs tels que l 'IA dans les voitures auto-conduites et la vision par ordinateur dans l'agriculture sur nos pages de solutions. Consultez nos options de licence yolo et donnez vie à vos projets de vision artificielle. 🚀

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement