Glossaire

Annotation des données

Qu'est-ce que l'annotation des données ? Découvrez comment l'étiquetage des données à l'aide de boîtes de délimitation ou de polygones est essentiel pour former des modèles d'IA et de vision par ordinateur précis.

L'annotation des données est le processus d'étiquetage ou de marquage des données brutes afin d'aider les modèles d'apprentissage automatique à les comprendre et à en tirer des enseignements. Cette étape critique transforme les données non structurées, comme les images ou les vidéos, en informations structurées que les algorithmes peuvent interpréter. Dans le contexte de l'apprentissage supervisé, ces annotations servent de "vérité de base", c'est-à-dire de réponses correctes que le modèle utilise pour s'entraîner. La qualité et la précision de l'annotation des données ont un impact direct sur les performances et la fiabilité du modèle d'intelligence artificielle (IA) qui en résulte. Sans annotations précises, même les modèles les plus avancés ne parviendront pas à apprendre des modèles de manière efficace.

Le rôle de l'annotation dans la vision par ordinateur

Dans le domaine de la vision par ordinateur, l'annotation des données est fondamentale pour apprendre aux modèles à "voir" et à interpréter le monde. Elle implique des annotateurs humains qui utilisent des logiciels spécialisés pour identifier et marquer les objets d'intérêt dans les données visuelles. Il existe plusieurs types d'annotation, chacun étant adapté à des tâches de vision artificielle différentes :

  • Annotation de la boîte englobante: Il s'agit de la forme la plus courante, utilisée pour la détection d'objets. Les annotateurs dessinent des boîtes rectangulaires autour des objets individuels et leur attribuent une étiquette de classe (par exemple, "voiture", "personne").
  • Segmentation polygonale : Pour les tâches nécessitant une plus grande précision, comme la segmentation des instances, les annotateurs tracent le contour exact de chaque objet. Cela permet au modèle de comprendre la forme et les limites spécifiques d'un objet, même lorsque les objets se chevauchent.
  • Segmentation sémantique: Cette méthode consiste à classer chaque pixel d'une image dans une catégorie spécifique (par exemple, "ciel", "route", "bâtiment"). Contrairement à la segmentation par instance, elle ne fait pas de distinction entre les différentes instances d'une même classe d'objets.
  • Annotation de points clés : Utilisée pour l'estimation de la pose, cette technique consiste à marquer des points d'intérêt spécifiques (points clés) sur un objet, tels que les articulations d'un corps humain ou les coins d'un visage.
  • Classification : La forme la plus simple, où une image entière se voit attribuer une seule étiquette. Cette méthode est fondamentale pour les tâches de classification d'images.

Le choix de la méthode d'annotation dépend des objectifs spécifiques du projet de CV, qui sont décrits dans le guide de définition des objectifs du projet.

Applications dans le monde réel

  1. Véhicules autonomes: Les voitures autonomes s'appuient sur des modèles formés à partir de données largement annotées. Les annotateurs étiquettent tout, des piétons et cyclistes aux feux de circulation, en passant par les marquages de voies et les panneaux de signalisation, dans des millions d'images et de nuages de points LiDAR. Ces données d'entraînement détaillées permettent au système de perception du véhicule de comprendre son environnement et de prendre des décisions de conduite sûres. Des ensembles de données comme Argoverse sont essentiels pour développer des solutions robustes d'IA dans l'automobile.
  2. Analyse d'images médicales: Dans le domaine de l'IA pour les soins de santé, les radiologues et les experts médicaux annotent les scanners médicaux tels que les IRM, les CT et les radiographies pour mettre en évidence les tumeurs, les lésions, les fractures ou d'autres anomalies. Ces ensembles de données annotées, tels que l'ensemble de données publiques sur les tumeurs cérébrales, sont utilisés pour former des modèles tels qu'Ultralytics YOLO, qui peuvent aider au diagnostic précoce et à la planification du traitement. La Radiological Society of North America (RSNA) fournit plusieurs ensembles de données de ce type pour la recherche.

Annotation des données et concepts connexes

L'annotation des données est souvent abordée en même temps que d'autres techniques de préparation des données, mais elles ont des objectifs différents.

  • Annotation des données et étiquetage des données: Ces deux termes sont souvent utilisés de manière interchangeable et renvoient au même processus de base. Dans le domaine de la vision artificielle, le terme "annotation" est souvent préféré pour décrire des tâches plus complexes telles que le dessin de polygones ou de points clés, tandis que le terme "étiquetage" peut être utilisé pour des tâches plus simples telles que la classification. Toutefois, à toutes fins utiles, ces deux termes sont synonymes. Pour un examen approfondi, vous pouvez consulter notre document d'explication sur l'étiquetage des données dans le domaine de la vision par ordinateur.
  • Annotation des données et augmentation des données: L'annotation est le processus de création des étiquettes initiales de vérité terrain. L'augmentation des données, quant à elle, est une technique utilisée après l' annotation pour augmenter artificiellement la taille de l'ensemble de données en créant des versions modifiées des images annotées (par exemple, en les faisant pivoter, en les retournant ou en changeant leur luminosité).
  • Annotation des données et nettoyage des données: Le nettoyage des données consiste à corriger les erreurs, à supprimer les doublons et à traiter les valeurs manquantes dans un ensemble de données afin d'en garantir la qualité globale. Le nettoyage peut avoir lieu avant l'annotation (par exemple, en supprimant les images floues) ou après (par exemple, en corrigeant les étiquettes incorrectes), mais il est distinct de l'acte d'ajouter de nouvelles étiquettes lui-même. La qualité des données est essentielle pour une annotation efficace.

Le processus d'annotation peut être géré à l'aide de différents outils, depuis les options open-source comme CVAT jusqu'aux plateformes commerciales comme Scale AI et Labelbox. Des plateformes comme Ultralytics HUB fournissent des solutions intégrées pour gérer les ensembles de données, former les modèles et rationaliser l'ensemble du flux de travail, de la collecte des données et de l'annotation au déploiement.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers