Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Annotation de données

Qu'est-ce que l'annotation de données ? Découvrez comment l'étiquetage des données avec des boîtes englobantes ou des polygones est essentiel pour l'entraînement de modèles d'IA et de vision par ordinateur précis.

L'annotation des données est le processus d'étiquetage, de marquage ou de transcription des données brutes afin de fournir un contexte qu'un modèle d'apprentissage machine (ML) peut comprendre. qu'un modèle d'apprentissage machine (ML) peut comprendre. Cette étape est fondamentale pour l'apprentissage supervisé, où les algorithmes s'appuient sur des exemples étiquetés pour apprendre des modèles et faire des prédictions. sur des exemples étiquetés pour apprendre des modèles et faire des prédictions. Les données annotées servent de vérité de base, représentant la réponse "correcte" que le modèle s'efforce de reproduire. que le modèle s'efforce de reproduire pendant la formation. Sans annotation précise, même des architectures sophistiquées comme Ultralytics YOLO11 ne peuvent fonctionner efficacement, car la performance du modèle est intrinsèquement liée à la qualité de ses données. performance du modèle est intrinsèquement liée à la qualité de ses données d'apprentissage. données d'apprentissage.

Le rôle de l'annotation dans la vision par ordinateur

Dans le domaine de la vision par ordinateur (VA), l'annotation des données consiste à marquer des caractéristiques spécifiques dans des images ou des trames vidéo. l'annotation des données consiste à marquer des caractéristiques spécifiques dans des images ou des trames vidéo. Différentes tâches requièrent des styles d'annotation distincts, chacun fournissant un niveau de détail unique au système. différents styles d'annotation, chacun fournissant un niveau de détail unique au système.

  • Détection d'objets: Annotateurs dessiner des boîtes de délimitation en 2D autour des objets d'intérêt, tels que des voitures ou des piétons. Le modèle apprend ainsi ce qu' est un objet et il se trouve.
  • Segmentation des instances: Cette technique consiste à tracer des polygones précis autour des objets. Contrairement aux boîtes englobantes, la segmentation permet de cartographier la forme et le contour exacts d'une entité. forme et le contour exacts d'une entité, ce qui est crucial pour des applications telles que la la saisie robotique.
  • Estimation de la pose: Les annotateurs marquent des "points clés" sur un sujet, comme les articulations d'un corps humain (coudes, genoux, épaules). Cela permet aux modèles de track mouvements et la posture.
  • Boîtes de délimitation orientées (OBB): Utilisées pour les objets qui ne sont pas alignés sur l'axe de l'image, tels que les navires sur les images satellite ou les paquets sur un tapis roulant. Ces boîtes peuvent pivoter pour s'adapter à l'orientation de l'objet.
  • Classification des images: La forme la plus simple d'annotation forme la plus simple d'annotation, où une seule étiquette (par exemple, "ensoleillé", "pluvieux") est attribuée à une image entière. image entière.

Les annotations sont généralement enregistrées dans des formats structurés tels que JSON, XML, ou des fichiers texte simples (par exemple, le format YOLO ), qui sont ensuite analysés par le logiciel de formation. logiciel de formation.

Applications concrètes

L'annotation des données alimente d'innombrables technologies modernes en comblant le fossé entre les capteurs bruts et la prise de décision intelligente. intelligente.

  1. Véhicules autonomes: Les voitures autonomes dépendent d'énormes ensembles de données où chaque marqueur de voie, panneau de signalisation et obstacle est annoté. Les données Les données des caméras et des capteurs LiDAR sont étiquetées afin d'entraîner le système de perception du véhicule à naviguer en toute sécurité. système de perception du véhicule à naviguer en toute sécurité. Ce niveau de détail est essentiel pour développer des solutions robustes d l 'IA dans l'automobile.
  2. Diagnostic médical : En l 'IA dans les soins de santé, les radiologues annotent IRM ou des radiographies pour mettre en évidence les tumeurs et les fractures. Ces images médicales annotées permettent aux modèles d'aider les médecins en signalant les anomalies potentielles avec une grande sensibilité. en signalant les anomalies potentielles avec une grande sensibilité.
  3. Commerce de détail intelligent : Les systèmes de caisse automatisés utilisent des annotations pour reconnaître les produits. En étiquetant En étiquetant des milliers d'articles d'épicerie, les systèmes peuvent faciliter l'expérience d'achat. En savoir plus sur L 'IA dans le commerce de détail.

Comparaison avec des concepts connexes

Il est utile de distinguer l'annotation des données des autres termes souvent utilisés dans le flux de travail de préparation des données.

  • Annotation ou étiquetage des données: Ces termes sont souvent utilisés de manière interchangeable. Cependant, l'"étiquetage" est souvent associé à des tâches de tâches de classification simples (attribution d'une catégorie), tandis que l'"annotation" implique souvent la génération de plus complexes, telles que le dessin de géométries (polygones, boîtes) ou le marquage d'horodatages dans une vidéo.
  • Annotation et augmentation des données: L'annotation crée les étiquettes initiales d'un ensemble de données. L'augmentation des données est un processus distinct qui artificiellement cet ensemble de données en modifiant les images annotées existantes (par exemple, en les retournant, en les faisant pivoter ou en changeant la luminosité) afin d'améliorer la robustesse du modèle. pour améliorer la robustesse du modèle.
  • Annotation vs. apprentissage actif: L'apprentissage actif est une stratégie dans laquelle le modèle identifie les points de données sur lesquels il est le plus confus et demande une annotation humaine uniquement pour ces exemples spécifiques, optimisant ainsi le budget d'annotation. l'annotation humaine uniquement pour ces exemples spécifiques, ce qui permet d'optimiser le budget d'annotation.

Outils et flux de travail

La création d'annotations de haute qualité nécessite souvent des outils spécialisés. Des options open-source telles que CVAT (Computer Vision Annotation Tool) et Label Studio fournissent des interfaces pour dessiner des boîtes et des polygones. Pour les opérations Pour les opérations à grande échelle, les équipes peuvent passer à des environnements intégrés tels que la future plateforme Ultralytics , qui rationalise le cycle de vie de l'approvisionnement en données jusqu'au déploiement du modèle. cycle de vie, de l'acquisition des données au déploiement du modèle.

Une fois les données annotées, elles peuvent être utilisées pour former un modèle. L'exemple suivant montre comment entraîner un modèle YOLO11 à l'aide d'un ensemble de données défini dans un fichier YAML, qui pointe vers les images et les étiquettes annotées.

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")

# Train on the COCO8 dataset, which contains pre-annotated images
# The 'data' argument references a YAML file defining dataset paths and classes
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant