Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
IA de vision

YOLO12 expliqué : Applications concrètes et cas d'utilisation

Découvre YOLO12, le tout dernier modèle de vision par ordinateur ! Apprends comment son architecture centrée sur l'attention et sa technologie FlashAttention améliorent les tâches de détection d'objets dans tous les secteurs.

ABAbirami Vina
5 min read
Détection d'objets YOLO12 dans des applications concrètes

La vision par ordinateur est une branche de l'intelligence artificielle (IA) qui aide les machines à comprendre les images et les vidéos. C'est un domaine qui progresse à une vitesse incroyable car les chercheurs et les développeurs en IA repoussent constamment les limites. La communauté IA cherche toujours à rendre les modèles plus rapides, plus intelligents et plus efficaces. L'une des dernières avancées est YOLO12, le tout dernier ajout à la série de modèles YOLO (You Only Look Once), publié le 18 février 2025.

YOLO12 a été développé par des chercheurs de l'Université de Buffalo, SUNY (State University of New York), et de l'Université de l'Académie chinoise des sciences. Avec une nouvelle approche unique, YOLO12 introduit des mécanismes d'attention, permettant au modèle de se concentrer sur les parties les plus essentielles d'une image plutôt que de tout traiter de manière égale.

Il intègre également FlashAttention, une technique qui accélère le traitement tout en utilisant moins de mémoire, ainsi qu'un mécanisme d'attention de zone, conçu pour imiter la façon dont les humains se concentrent naturellement sur les objets centraux.

Ces améliorations rendent YOLO12n 2,1 % plus précis que YOLOv10n et YOLO12m 1,0 % plus précis que YOLO11m. Cependant, cela s'accompagne d'un compromis : YOLO12n est 9 % plus lent que YOLOv10n, et YOLO12m est 3 % plus lent que YOLO11m.

YOLO12 utilisé pour la détection d'objets

Fig 1. Un exemple de YOLO12 utilisé pour détecter des objets.

Dans cet article, nous allons explorer ce qui différencie YOLO12, comment il se compare aux versions précédentes et où il peut être appliqué.

Link to this sectionLe chemin vers la sortie de YOLO12#

La série de modèles YOLO est une collection de modèles de vision par ordinateur conçus pour la détection d'objets en temps réel, ce qui signifie qu'ils peuvent identifier et localiser rapidement des objets dans des images et des vidéos. Au fil du temps, chaque version s'est améliorée en termes de vitesse, de précision et d'efficacité.

Par exemple, Ultralytics YOLOv5, sorti en 2020, est devenu largement utilisé parce qu'il était rapide et facile à entraîner sur mesure et à déployer. Plus tard, Ultralytics YOLOv8 a amélioré cela en offrant une prise en charge supplémentaire pour les tâches de vision par ordinateur comme la segmentation d'instance et le suivi d'objets.

Plus récemment, Ultralytics YOLO11 s'est concentré sur l'amélioration du traitement en temps réel tout en maintenant un équilibre entre vitesse et précision. Par exemple, YOLO11m avait 22 % de paramètres en moins que YOLOv8m, tout en offrant de meilleures performances de détection sur le dataset COCO, un benchmark largement utilisé pour évaluer les modèles de détection d'objets.

S'appuyant sur ces avancées, YOLO12 introduit un changement dans la manière dont il traite l'information visuelle. Plutôt que de traiter toutes les parties d'une image de manière égale, il donne la priorité aux zones les plus pertinentes, améliorant ainsi la précision de détection. Pour faire simple, YOLO12 s'appuie sur les améliorations précédentes tout en visant à être plus précis.

Link to this sectionFonctionnalités clés de YOLO12#

YOLO12 introduit plusieurs améliorations qui renforcent les tâches de vision par ordinateur tout en conservant des vitesses de traitement en temps réel. Voici un aperçu des fonctionnalités clés de YOLO12 :

  • Architecture centrée sur l'attention : Au lieu de traiter chaque partie d'une image de manière égale, YOLO12 se concentre sur les zones les plus importantes. Cela améliore la précision et réduit le traitement inutile, rendant la détection plus nette et plus efficace, même dans des images encombrées.
  • FlashAttention : YOLO12 accélère l'analyse d'image tout en utilisant moins de mémoire. Avec FlashAttention (un algorithme efficace en termes de mémoire), il optimise le traitement des données, réduisant la charge matérielle et rendant les tâches en temps réel plus fluides et plus fiables.
  • Réseaux d'agrégation de couches efficaces résiduelles (R-ELAN) : YOLO12 organise ses couches plus efficacement en utilisant R-ELAN, ce qui améliore la façon dont le modèle traite et apprend à partir des données. Cela rend l'entraînement plus stable, la reconnaissance d'objets plus nette et les besoins en calcul plus faibles, de sorte qu'il fonctionne efficacement dans différents environnements.

Pour comprendre comment ces fonctionnalités fonctionnent dans la vie réelle, prends l'exemple d'un centre commercial. YOLO12 peut aider à suivre les acheteurs, identifier les décorations de magasin comme des plantes en pot ou des panneaux promotionnels, et repérer des objets égarés ou abandonnés.

Son architecture centrée sur l'attention l'aide à se concentrer sur les détails les plus importants, tandis que FlashAttention garantit qu'il traite tout rapidement sans surcharger le système. Cela permet aux opérateurs de centres commerciaux d'améliorer plus facilement la sécurité, d'organiser les agencements des magasins et d'améliorer l'expérience d'achat globale.

Détection d'objets dans un centre commercial avec YOLO12

Fig 2. Détection d'objets dans un centre commercial en utilisant YOLO12.

Cependant, YOLO12 présente aussi quelques limitations à prendre en compte :

  • Temps d'entraînement plus longs : En raison de son architecture, YOLO12 nécessite plus de temps d'entraînement par rapport à YOLO11.
  • Défis d'exportation : Certains utilisateurs peuvent rencontrer des difficultés lors de l'exportation des modèles YOLO12, en particulier lors de leur intégration dans des environnements de déploiement spécifiques.

Link to this sectionComprendre les benchmarks de performance de YOLO12#

YOLO12 se décline en plusieurs variantes, chacune optimisée pour des besoins différents. Les versions plus petites (nano et small) privilégient la vitesse et l'efficacité, ce qui les rend idéales pour les appareils mobiles et l'Edge Computing. Les versions medium et large trouvent un équilibre entre vitesse et précision, tandis que YOLO12x (extra large) est conçu pour des applications de haute précision, telles que l'automatisation industrielle, l'imagerie médicale et les systèmes de surveillance avancés.

Avec ces variations, YOLO12 offre différents niveaux de performance en fonction de la taille du modèle. Les tests de benchmark montrent que certaines variantes de YOLO12 surpassent YOLOv10 et YOLO11 en précision, atteignant une précision moyenne (mAP) plus élevée.

Cependant, certains modèles, comme YOLO12m, YOLO12l et YOLO12x, traitent les images plus lentement que YOLO11, montrant un compromis entre précision de détection et vitesse. Malgré cela, YOLO12 reste efficace, nécessitant moins de paramètres que beaucoup d'autres modèles, bien qu'il en utilise toujours plus que YOLO11. Cela en fait un excellent choix pour les applications où la précision est plus importante que la vitesse brute.

Comparaison entre Ultralytics YOLO11 et YOLO12

Fig 3. Comparaison d'Ultralytics YOLO11 et YOLO12.

Link to this sectionUtiliser YOLO12 via le package Python Ultralytics#

YOLO12 est pris en charge par le package Python Ultralytics et est facile à utiliser, ce qui le rend accessible aux débutants comme aux professionnels. Avec seulement quelques lignes de code, tu peux charger des modèles pré-entraînés, exécuter diverses tâches de vision par ordinateur sur des images et des vidéos, et également entraîner YOLO12 sur des datasets personnalisés. Le package Python Ultralytics rationalise le processus, éliminant le besoin d'étapes de configuration complexes.

Par exemple, voici les étapes que tu suivrais pour utiliser YOLO12 pour la détection d'objets :

  • Installer le package Ultralytics : Tout d'abord, installe le package Python Ultralytics, qui fournit les outils nécessaires pour exécuter YOLO12 efficacement. Cela garantit que toutes les dépendances sont correctement configurées.
  • Charger un modèle YOLO12 pré-entraîné : Choisis la variante YOLO12 appropriée (nano, small, medium, large ou extra large) en fonction du niveau de précision et de vitesse requis pour ta tâche.
  • Fournir une image ou une vidéo : Saisis un fichier image ou vidéo que tu souhaites analyser. YOLO12 peut également traiter des flux vidéo en direct pour une détection en temps réel.
  • Exécuter le processus de détection : Le modèle scanne les données visuelles, identifie les objets et place des boîtes englobantes (BBox) autour d'eux. Il étiquette chaque objet détecté avec sa classe prédite et son score de confiance.
  • Ajuster les paramètres de détection : Tu peux également modifier des paramètres tels que les seuils de confiance pour affiner la précision et les performances de détection.
  • Enregistrer ou utiliser la sortie : L'image ou la vidéo traitée, contenant désormais les objets détectés, peut être enregistrée ou intégrée dans une application pour une analyse ultérieure, une automatisation ou une prise de décision.

Ces étapes rendent YOLO12 facile à utiliser pour une variété d'applications, de la surveillance et du suivi de détail à l'imagerie médicale et aux véhicules autonomes.

Link to this sectionApplications pratiques de YOLO12#

YOLO12 peut être utilisé dans diverses applications réelles grâce à sa prise en charge de la détection d'objets, de la segmentation d'instance, de la classification d'images, de l'estimation de pose et de la détection d'objets orientés (OBB).

YOLO12 prenant en charge des tâches comme la détection d'objets et la segmentation d'instances

Fig 4. YOLO12 prend en charge des tâches comme la détection d'objets et la segmentation d'instance.

Cependant, comme nous l'avons discuté précédemment, les modèles YOLO12 privilégient la précision à la vitesse, ce qui signifie qu'ils mettent un peu plus de temps à traiter les images par rapport aux versions précédentes. Ce compromis rend YOLO12 idéal pour les applications où la précision est plus importante que la vitesse en temps réel, telles que :

  • Imagerie médicale : YOLO12 peut être entraîné sur mesure pour détecter des tumeurs ou des anomalies dans des radiographies et des IRM avec une grande précision, ce qui en fait un outil utile pour les médecins et les radiologues qui ont besoin d'une analyse d'image précise pour le diagnostic.
  • Contrôle qualité dans la fabrication : Il peut aider à identifier les défauts des produits pendant le processus de production, en garantissant que seuls les articles de haute qualité arrivent sur le marché, tout en réduisant le gaspillage et en améliorant l'efficacité.
  • Analyse forensique : Les forces de l'ordre peuvent affiner YOLO12 pour analyser des images de surveillance et rassembler des preuves. Dans les enquêtes criminelles, la précision est vitale pour identifier des détails clés.
  • Agriculture de précision : Les agriculteurs peuvent utiliser YOLO12 pour analyser la santé des cultures, détecter des maladies ou des infestations de parasites, et surveiller les conditions du sol. Des évaluations précises aident à optimiser les stratégies agricoles, conduisant à un meilleur rendement et à une meilleure gestion des ressources.

Link to this sectionDémarrer avec YOLO12#

Avant d'exécuter YOLO12, il est important de t'assurer que ton système répond aux exigences nécessaires.

Techniquement, YOLO12 peut s'exécuter sur n'importe quel GPU (Graphics Processing Unit) dédié. Par défaut, il ne nécessite pas FlashAttention, il peut donc fonctionner sur la plupart des systèmes GPU sans cela. Cependant, l'activation de FlashAttention peut être particulièrement utile lors du travail avec de grands datasets ou des images haute résolution, car elle aide à éviter les ralentissements, à réduire l'utilisation de la mémoire et à améliorer l'efficacité du traitement.

Pour utiliser FlashAttention, tu auras besoin d'un GPU NVIDIA de l'une de ces séries : Turing (T4, Quadro RTX), Ampere (série RTX 30, A30, A40, A100), Ada Lovelace (série RTX 40), ou Hopper (H100, H200).

Gardant à l'esprit la convivialité et l'accessibilité, le package Python Ultralytics ne prend pas encore en charge l'inférence FlashAttention, car son installation peut être techniquement complexe. Pour en savoir plus sur la prise en main de YOLO12 et l'optimisation de ses performances, consulte la documentation officielle Ultralytics.

Link to this sectionPoints clés#

À mesure que la vision par ordinateur progresse, les modèles deviennent plus précis et efficaces. YOLO12 améliore les tâches de vision par ordinateur comme la détection d'objets, la segmentation d'instance et la classification d'images grâce à un traitement centré sur l'attention et à FlashAttention, améliorant la précision tout en optimisant l'utilisation de la mémoire.

En même temps, la vision par ordinateur est plus accessible que jamais. YOLO12 est facile à utiliser via le package Python Ultralytics et, avec son accent sur la précision plutôt que sur la vitesse, il est bien adapté à l'imagerie médicale, aux inspections industrielles et à la robotique - des applications où la précision est clé.

Curieux à propos de l'IA ? Visite notre dépôt GitHub et engage-toi auprès de notre communauté. Explore les innovations dans des secteurs comme l'IA dans les voitures autonomes et la vision par ordinateur dans l'agriculture sur nos pages de solutions. Découvre nos options de licence et donne vie à tes projets d'IA visuelle. 🚀

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique