Annotation de données
Qu'est-ce que l'annotation de données ? Découvrez comment l'étiquetage des données avec des boîtes englobantes ou des polygones est essentiel pour l'entraînement de modèles d'IA et de vision par ordinateur précis.
L'annotation des données est le processus essentiel qui consiste à étiqueter, marquer ou transcrire des données brutes afin de fournir le contexte nécessaire
à l'apprentissage d'un modèle d'apprentissage automatique (ML)
. Cette étape est la pierre angulaire de l'
apprentissage supervisé, une méthode dans laquelle les algorithmes
sont entraînés sur des paires d'entrées-sorties afin de reconnaître des modèles et de faire des prédictions. Les informations étiquetées servent de
référence, représentant le résultat idéal que le modèle
s'efforce de reproduire. Sans annotation précise et cohérente, même les architectures avancées telles que
Ultralytics ne peuvent pas fonctionner efficacement, car la
précision du système dépend directement de la qualité de ses
données d'entraînement.
Types d'annotations courants en vision par ordinateur
Dans le domaine de la vision par ordinateur (CV), l'annotation des données
consiste à marquer des caractéristiques spécifiques dans des images ou des trames vidéo. La méthode utilisée dépend fortement de la
tâche spécifique pour laquelle le modèle est conçu.
-
Détection d'objets: les annotateurs
dessinent des cadres 2D autour des objets d'intérêt,
tels que les véhicules ou les piétons. Cela permet d'apprendre au modèle ce qu'est un objet et où il se trouve dans la scène.
-
Segmentation d'instance:
Cette technique consiste à tracer des polygones précis autour des contours d'un objet. Contrairement aux boîtes simples, la segmentation
cartographie la forme et le contour exacts, ce qui est essentiel pour les tâches nécessitant une grande précision, comme la
préhension robotique.
-
Estimation de la pose: les annotateurs marquent
des points clés spécifiques sur un sujet, tels que les articulations
du corps humain (coudes, genoux, épaules). Cela permet aux modèles de track , la posture et même d'analyser les performances athlétiques
.
-
Classification d'images: Il s'agit de la
forme la plus simple, où une seule étiquette de catégorie (par exemple, « feuille saine » ou « feuille malade »)
est attribuée à l'ensemble d'une image.
Applications concrètes
L'annotation des données comble le fossé entre les données brutes des capteurs et la prise de décision intelligente dans divers secteurs.
-
Agriculture intelligente : dans le domaine de l'
IA appliquée à l'agriculture, de vastes ensembles de données d'images de cultures
sont annotés afin d'identifier les mauvaises herbes, les parasites ou les carences en nutriments. En entraînant des modèles à partir de ces données, les agriculteurs
peuvent automatiser la surveillance des cultures et n'appliquer des traitements que lorsque cela est nécessaire, ce qui réduit le gaspillage et améliore le rendement.
-
Conduite autonome : les voitures autonomes s'appuient sur d'énormes bibliothèques de données annotées où chaque marquage routier
, panneau de signalisation et obstacle est étiqueté. Les données provenant des caméras et des
capteurs LiDAR sont traitées pour entraîner le système de perception du véhicule
, garantissant ainsi qu'il peut naviguer en toute sécurité dans des scénarios de circulation complexes.
Distinguer les concepts apparentés
Il est utile de différencier l'annotation des données des autres termes souvent utilisés dans le processus de préparation des ensembles de données.
-
Annotation vs étiquetage des données:
Bien que ces termes soient souvent utilisés de manière interchangeable, « étiquetage » fait généralement référence à des tâches de classification plus simples (attribution d'une
balise), tandis que « annotation » implique la génération de métadonnées plus riches, telles que le dessin de géométries complexes ou le marquage d'
horodatages dans une vidéo.
-
Annotation vs augmentation des données:
L'annotation crée la vérité terrain initiale. L'augmentation est un processus ultérieur qui élargit artificiellement l'
ensemble de données en appliquant des transformations (telles que des rotations ou des changements de couleur) aux images annotées existantes afin d'améliorer la robustesse du modèle
.
-
Annotation vs apprentissage actif:
L'apprentissage actif est une stratégie dans laquelle le modèle identifie les points de données spécifiques qu'il trouve les plus confus et
demande une annotation humaine uniquement pour ces exemples, optimisant ainsi le temps et le coût du processus d'annotation.
Outils et flux de travail
La création d'annotations de haute qualité nécessite généralement un logiciel spécialisé qui exporte les données dans des formats standard tels que
JSON ou XML. Les flux de travail modernes
s'orientent de plus en plus vers des environnements intégrés tels que Ultralytics , qui rationalise l'approvisionnement en données, l'annotation automatique et la
formation des modèles dans une seule interface.
Une fois les données annotées, elles sont référencées dans un fichier de configuration (souvent au format YAML) pour l'entraînement. L'exemple suivant
montre comment entraîner un modèle YOLO26 à l'aide de COCO8 standard
COCO8 , qui est fourni avec des annotations préexistantes
.
from ultralytics import YOLO
# Load the latest YOLO26 model (nano version)
model = YOLO("yolo26n.pt")
# Train the model using a dataset configuration file
# The YAML file points to the annotated images and labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)