Anotación de datos
¿Qué es la anotación de datos? Aprenda cómo el etiquetado de datos con bounding boxes o polígonos es esencial para entrenar modelos de IA y visión artificial precisos.
La anotación de datos es el proceso crítico de etiquetar, marcar o transcribir datos sin procesar para proporcionar el contexto necesario
que un modelo de aprendizaje automático (ML)
requiere para aprender. Este paso es la piedra angular del
aprendizaje supervisado, un método en el que los algoritmos
se entrenan con pares de entrada-salida para reconocer patrones y hacer predicciones. La información etiquetada actúa como la
verdad fundamental, representando el resultado ideal que el modelo
se esfuerza por replicar. Sin una anotación precisa y coherente, incluso arquitecturas avanzadas como
Ultralytics no pueden funcionar eficazmente, ya que la
precisión del sistema depende directamente de la calidad de sus
datos de entrenamiento.
Tipos comunes de anotaciones en visión artificial
En el ámbito de la visión artificial (CV), la anotación de datos
implica marcar características específicas dentro de imágenes o fotogramas de vídeo. El método utilizado depende en gran medida de la
tarea específica para la que se está construyendo el modelo.
-
Detección de objetos: los anotadores
dibujan cuadros delimitadores en 2D alrededor de los objetos de interés,
como vehículos o peatones. Esto enseña al modelo qué es un objeto y dónde se encuentra dentro de la escena.
-
Segmentación de instancias:
Esta técnica consiste en trazar polígonos precisos alrededor de los bordes de un objeto. A diferencia de las cajas simples, la segmentación
mapea la forma y el contorno exactos, lo cual es vital para tareas que requieren alta precisión, como
el agarre robótico.
-
Estimación de la postura: los anotadores marcan
puntos clave específicos en un sujeto, como las articulaciones
del cuerpo humano (codos, rodillas, hombros). Esto permite a los modelos track , la postura e incluso analizar el
rendimiento deportivo.
-
Clasificación de imágenes: Esta
es la forma más simple, en la que se asigna una única etiqueta de categoría (por ejemplo, «hoja sana» frente a «hoja enferma»)
a toda una imagen.
Aplicaciones en el mundo real
La anotación de datos cierra la brecha entre los datos brutos de los sensores y la toma de decisiones inteligentes en diversos sectores.
-
Agricultura inteligente: En la
IA aplicada a la agricultura, se anotan vastos conjuntos de datos de imágenes de cultivos
para identificar malas hierbas, plagas o deficiencias nutricionales. Al entrenar modelos con estos datos, los agricultores
pueden automatizar la supervisión de los cultivos y aplicar tratamientos solo cuando es necesario, lo que reduce el desperdicio y mejora el rendimiento.
-
Conducción autónoma: los coches autónomos se basan en enormes bibliotecas de datos anotados en las que se etiqueta cada marcador de carril,
señal de tráfico y obstáculo. Los datos de las cámaras y los
sensores LiDAR se procesan para entrenar el sistema de percepción del vehículo,
lo que garantiza que pueda navegar con seguridad por situaciones de tráfico complejas.
Distinguir conceptos relacionados
Es útil diferenciar la anotación de datos de otros términos que se utilizan con frecuencia en el flujo de trabajo de preparación de conjuntos de datos.
-
Anotación frente a etiquetado de datos:
Aunque a menudo se utilizan indistintamente, el término «etiquetado» suele referirse a tareas de clasificación más sencillas (asignar una
etiqueta), mientras que «anotación» implica la generación de metadatos más ricos, como dibujar geometrías complejas o marcar
marcas de tiempo en vídeos.
-
Anotación frente a aumento de datos:
La anotación crea la verdad fundamental inicial. El aumento es un proceso posterior que amplía artificialmente el
conjunto de datos aplicando transformaciones (como rotaciones o cambios de color) a las imágenes anotadas existentes para mejorar la solidez del modelo
.
-
Anotación frente a aprendizaje activo:
El aprendizaje activo es una estrategia en la que el modelo identifica qué puntos de datos específicos le resultan más confusos y
solicita anotaciones humanas solo para esos ejemplos, optimizando así el tiempo y el coste del proceso de anotación.
Herramientas y flujo de trabajo
La creación de anotaciones de alta calidad suele requerir software especializado que exporte datos en formatos estándar como
JSON o XML. Los flujos de trabajo modernos
se inclinan cada vez más hacia entornos integrados como la
Ultralytics , que agiliza la obtención de datos, la anotación automática y el
entrenamiento de modelos en una sola interfaz.
Una vez anotados los datos, se hace referencia a ellos en un archivo de configuración (a menudo YAML) para el entrenamiento. El siguiente ejemplo
muestra cómo entrenar un modelo YOLO26 utilizando el COCO8 estándar
COCO8 , que viene con anotaciones preexistentes
.
from ultralytics import YOLO
# Load the latest YOLO26 model (nano version)
model = YOLO("yolo26n.pt")
# Train the model using a dataset configuration file
# The YAML file points to the annotated images and labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)