Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Annotation de données

Qu'est-ce que l'annotation de données ? Découvrez comment l'étiquetage des données avec des boîtes englobantes ou des polygones est essentiel pour l'entraînement de modèles d'IA et de vision par ordinateur précis.

L'annotation des données est le processus essentiel qui consiste à étiqueter, marquer ou transcrire des données brutes afin de fournir le contexte nécessaire à l'apprentissage d'un modèle d'apprentissage automatique (ML) . Cette étape est la pierre angulaire de l' apprentissage supervisé, une méthode dans laquelle les algorithmes sont entraînés sur des paires d'entrées-sorties afin de reconnaître des modèles et de faire des prédictions. Les informations étiquetées servent de référence, représentant le résultat idéal que le modèle s'efforce de reproduire. Sans annotation précise et cohérente, même les architectures avancées telles que Ultralytics ne peuvent pas fonctionner efficacement, car la précision du système dépend directement de la qualité de ses données d'entraînement.

Types d'annotations courants en vision par ordinateur

Dans le domaine de la vision par ordinateur (CV), l'annotation des données consiste à marquer des caractéristiques spécifiques dans des images ou des trames vidéo. La méthode utilisée dépend fortement de la tâche spécifique pour laquelle le modèle est conçu.

  • Détection d'objets: les annotateurs dessinent des cadres 2D autour des objets d'intérêt, tels que les véhicules ou les piétons. Cela permet d'apprendre au modèle ce qu'est un objet et où il se trouve dans la scène.
  • Segmentation d'instance: Cette technique consiste à tracer des polygones précis autour des contours d'un objet. Contrairement aux boîtes simples, la segmentation cartographie la forme et le contour exacts, ce qui est essentiel pour les tâches nécessitant une grande précision, comme la préhension robotique.
  • Estimation de la pose: les annotateurs marquent des points clés spécifiques sur un sujet, tels que les articulations du corps humain (coudes, genoux, épaules). Cela permet aux modèles de track , la posture et même d'analyser les performances athlétiques .
  • Classification d'images: Il s'agit de la forme la plus simple, où une seule étiquette de catégorie (par exemple, « feuille saine » ou « feuille malade ») est attribuée à l'ensemble d'une image.

Applications concrètes

L'annotation des données comble le fossé entre les données brutes des capteurs et la prise de décision intelligente dans divers secteurs.

  1. Agriculture intelligente : dans le domaine de l' IA appliquée à l'agriculture, de vastes ensembles de données d'images de cultures sont annotés afin d'identifier les mauvaises herbes, les parasites ou les carences en nutriments. En entraînant des modèles à partir de ces données, les agriculteurs peuvent automatiser la surveillance des cultures et n'appliquer des traitements que lorsque cela est nécessaire, ce qui réduit le gaspillage et améliore le rendement.
  2. Conduite autonome : les voitures autonomes s'appuient sur d'énormes bibliothèques de données annotées où chaque marquage routier , panneau de signalisation et obstacle est étiqueté. Les données provenant des caméras et des capteurs LiDAR sont traitées pour entraîner le système de perception du véhicule , garantissant ainsi qu'il peut naviguer en toute sécurité dans des scénarios de circulation complexes.

Distinguer les concepts apparentés

Il est utile de différencier l'annotation des données des autres termes souvent utilisés dans le processus de préparation des ensembles de données.

  • Annotation vs étiquetage des données: Bien que ces termes soient souvent utilisés de manière interchangeable, « étiquetage » fait généralement référence à des tâches de classification plus simples (attribution d'une balise), tandis que « annotation » implique la génération de métadonnées plus riches, telles que le dessin de géométries complexes ou le marquage d' horodatages dans une vidéo.
  • Annotation vs augmentation des données: L'annotation crée la vérité terrain initiale. L'augmentation est un processus ultérieur qui élargit artificiellement l' ensemble de données en appliquant des transformations (telles que des rotations ou des changements de couleur) aux images annotées existantes afin d'améliorer la robustesse du modèle .
  • Annotation vs apprentissage actif: L'apprentissage actif est une stratégie dans laquelle le modèle identifie les points de données spécifiques qu'il trouve les plus confus et demande une annotation humaine uniquement pour ces exemples, optimisant ainsi le temps et le coût du processus d'annotation.

Outils et flux de travail

La création d'annotations de haute qualité nécessite généralement un logiciel spécialisé qui exporte les données dans des formats standard tels que JSON ou XML. Les flux de travail modernes s'orientent de plus en plus vers des environnements intégrés tels que Ultralytics , qui rationalise l'approvisionnement en données, l'annotation automatique et la formation des modèles dans une seule interface.

Une fois les données annotées, elles sont référencées dans un fichier de configuration (souvent au format YAML) pour l'entraînement. L'exemple suivant montre comment entraîner un modèle YOLO26 à l'aide de COCO8 standard COCO8 , qui est fourni avec des annotations préexistantes .

from ultralytics import YOLO

# Load the latest YOLO26 model (nano version)
model = YOLO("yolo26n.pt")

# Train the model using a dataset configuration file
# The YAML file points to the annotated images and labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant