Anotación de datos
¿Qué es la anotación de datos? Aprenda cómo el etiquetado de datos con bounding boxes o polígonos es esencial para entrenar modelos de IA y visión artificial precisos.
La anotación de datos es el proceso de etiquetar o marcar datos brutos para ayudar a los modelos de aprendizaje automático (ML) a comprender y aprender de ellos. Este paso crítico transforma los datos no estructurados, como imágenes o vídeos, en información estructurada que los algoritmos pueden interpretar. En el contexto del aprendizaje supervisado, estas anotaciones sirven como la "verdad fundamental", las respuestas correctas que el modelo utiliza para entrenarse. La calidad y la precisión de la anotación de datos impactan directamente en el rendimiento y la fiabilidad del modelo de inteligencia artificial (IA) resultante. Sin anotaciones precisas, incluso los modelos más avanzados no podrán aprender patrones de forma eficaz.
El papel de la anotación en la visión artificial
En visión artificial (CV), la anotación de datos es fundamental para enseñar a los modelos a "ver" e interpretar el mundo. Implica que los anotadores humanos utilicen software especializado para identificar y marcar objetos de interés dentro de los datos visuales. Existen varios tipos de anotación, cada uno adecuado para diferentes tareas de CV:
- Anotación de bounding box: Esta es la forma más común, utilizada para la detección de objetos. Los anotadores dibujan cuadros rectangulares alrededor de objetos individuales y asignan una etiqueta de clase (por ejemplo, "coche", "persona").
- Segmentación poligonal: Para tareas que requieren mayor precisión, como la segmentación de instancias, los anotadores trazan el contorno exacto de cada objeto. Esto permite que el modelo comprenda la forma y los límites específicos de un objeto, incluso cuando los objetos se superponen.
- Segmentación Semántica: Este método implica clasificar cada píxel de una imagen en una categoría específica (por ejemplo, "cielo", "carretera", "edificio"). A diferencia de la segmentación de instancias, no distingue entre diferentes instancias de la misma clase de objeto.
- Anotación de puntos clave: Utilizada para la estimación de pose, esta técnica implica marcar puntos de interés específicos (puntos clave) en un objeto, como las articulaciones de un cuerpo humano o las esquinas de una cara.
- Clasificación: La forma más simple, donde a una imagen completa se le asigna una sola etiqueta. Esto es fundamental para las tareas de clasificación de imágenes.
La elección del método de anotación depende de los objetivos específicos del proyecto de CV, que se describen en la guía para definir los objetivos del proyecto.
Aplicaciones en el mundo real
- Vehículos Autónomos: Los coches autónomos se basan en modelos entrenados con datos extensamente anotados. Los anotadores etiquetan todo, desde peatones y ciclistas hasta semáforos, marcas viales y señales de tráfico en millones de imágenes y nubes de puntos LiDAR. Estos datos de entrenamiento detallados permiten que el sistema de percepción del vehículo comprenda su entorno y tome decisiones de conducción seguras. Conjuntos de datos como Argoverse son cruciales para desarrollar soluciones robustas de IA en el sector automotriz.
- Análisis de imágenes médicas: En la IA para la atención médica, los radiólogos y los expertos médicos anotan exploraciones médicas como resonancias magnéticas, tomografías computarizadas y radiografías para resaltar tumores, lesiones, fracturas u otras anomalías. Estos conjuntos de datos anotados, como el conjunto de datos de tumores cerebrales público, se utilizan para entrenar modelos como Ultralytics YOLO que pueden ayudar en el diagnóstico temprano y la planificación del tratamiento. La Sociedad Radiológica de Norteamérica (RSNA) proporciona varios conjuntos de datos de este tipo para la investigación.
Anotación de datos vs. Conceptos relacionados
La anotación de datos se suele tratar junto con otras técnicas de preparación de datos, pero tienen propósitos diferentes.
- Anotación de datos vs. Etiquetado de datos: Estos dos términos se utilizan con frecuencia indistintamente y se refieren al mismo proceso central. "Anotación" se prefiere a menudo en la visión artificial para describir tareas más complejas como dibujar polígonos o puntos clave, mientras que "etiquetado" podría utilizarse para tareas más sencillas como la clasificación. Sin embargo, a todos los efectos prácticos, son sinónimos. Para una visión en profundidad, puede leer más en nuestra explicación sobre el etiquetado de datos para la visión artificial.
- Anotación de datos vs. Aumento de datos: La anotación es el proceso de creación de las etiquetas iniciales de verdad fundamental. El aumento de datos, por otro lado, es una técnica utilizada después de la anotación para aumentar artificialmente el tamaño del conjunto de datos mediante la creación de versiones modificadas de las imágenes anotadas (por ejemplo, rotando, volteando o cambiando el brillo).
- Anotación de datos vs. Limpieza de datos: La limpieza de datos implica corregir errores, eliminar duplicados y gestionar los valores que faltan dentro de un conjunto de datos para garantizar su calidad general. La limpieza puede ocurrir antes de la anotación (por ejemplo, eliminar imágenes borrosas) o después (por ejemplo, corregir etiquetas incorrectas), pero es distinta del acto de añadir nuevas etiquetas en sí. Una alta calidad de los datos es esencial para una anotación eficaz.
El proceso de anotación se puede gestionar utilizando varias herramientas, desde opciones de código abierto como CVAT hasta plataformas comerciales como Scale AI y Labelbox. Plataformas como Ultralytics HUB proporcionan soluciones integradas para gestionar conjuntos de datos, entrenar modelos y optimizar todo el flujo de trabajo desde la recopilación y anotación de datos hasta la implementación.