Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Anotación de datos

¿Qué es la anotación de datos? Aprenda cómo el etiquetado de datos con bounding boxes o polígonos es esencial para entrenar modelos de IA y visión artificial precisos.

La anotación de datos es el proceso crítico de etiquetar, marcar o transcribir datos sin procesar para proporcionar el contexto necesario que un modelo de aprendizaje automático (ML) requiere para aprender. Este paso es la piedra angular del aprendizaje supervisado, un método en el que los algoritmos se entrenan con pares de entrada-salida para reconocer patrones y hacer predicciones. La información etiquetada actúa como la verdad fundamental, representando el resultado ideal que el modelo se esfuerza por replicar. Sin una anotación precisa y coherente, incluso arquitecturas avanzadas como Ultralytics no pueden funcionar eficazmente, ya que la precisión del sistema depende directamente de la calidad de sus datos de entrenamiento.

Tipos comunes de anotaciones en visión artificial

En el ámbito de la visión artificial (CV), la anotación de datos implica marcar características específicas dentro de imágenes o fotogramas de vídeo. El método utilizado depende en gran medida de la tarea específica para la que se está construyendo el modelo.

  • Detección de objetos: los anotadores dibujan cuadros delimitadores en 2D alrededor de los objetos de interés, como vehículos o peatones. Esto enseña al modelo qué es un objeto y dónde se encuentra dentro de la escena.
  • Segmentación de instancias: Esta técnica consiste en trazar polígonos precisos alrededor de los bordes de un objeto. A diferencia de las cajas simples, la segmentación mapea la forma y el contorno exactos, lo cual es vital para tareas que requieren alta precisión, como el agarre robótico.
  • Estimación de la postura: los anotadores marcan puntos clave específicos en un sujeto, como las articulaciones del cuerpo humano (codos, rodillas, hombros). Esto permite a los modelos track , la postura e incluso analizar el rendimiento deportivo.
  • Clasificación de imágenes: Esta es la forma más simple, en la que se asigna una única etiqueta de categoría (por ejemplo, «hoja sana» frente a «hoja enferma») a toda una imagen.

Aplicaciones en el mundo real

La anotación de datos cierra la brecha entre los datos brutos de los sensores y la toma de decisiones inteligentes en diversos sectores.

  1. Agricultura inteligente: En la IA aplicada a la agricultura, se anotan vastos conjuntos de datos de imágenes de cultivos para identificar malas hierbas, plagas o deficiencias nutricionales. Al entrenar modelos con estos datos, los agricultores pueden automatizar la supervisión de los cultivos y aplicar tratamientos solo cuando es necesario, lo que reduce el desperdicio y mejora el rendimiento.
  2. Conducción autónoma: los coches autónomos se basan en enormes bibliotecas de datos anotados en las que se etiqueta cada marcador de carril, señal de tráfico y obstáculo. Los datos de las cámaras y los sensores LiDAR se procesan para entrenar el sistema de percepción del vehículo, lo que garantiza que pueda navegar con seguridad por situaciones de tráfico complejas.

Distinguir conceptos relacionados

Es útil diferenciar la anotación de datos de otros términos que se utilizan con frecuencia en el flujo de trabajo de preparación de conjuntos de datos.

  • Anotación frente a etiquetado de datos: Aunque a menudo se utilizan indistintamente, el término «etiquetado» suele referirse a tareas de clasificación más sencillas (asignar una etiqueta), mientras que «anotación» implica la generación de metadatos más ricos, como dibujar geometrías complejas o marcar marcas de tiempo en vídeos.
  • Anotación frente a aumento de datos: La anotación crea la verdad fundamental inicial. El aumento es un proceso posterior que amplía artificialmente el conjunto de datos aplicando transformaciones (como rotaciones o cambios de color) a las imágenes anotadas existentes para mejorar la solidez del modelo .
  • Anotación frente a aprendizaje activo: El aprendizaje activo es una estrategia en la que el modelo identifica qué puntos de datos específicos le resultan más confusos y solicita anotaciones humanas solo para esos ejemplos, optimizando así el tiempo y el coste del proceso de anotación.

Herramientas y flujo de trabajo

La creación de anotaciones de alta calidad suele requerir software especializado que exporte datos en formatos estándar como JSON o XML. Los flujos de trabajo modernos se inclinan cada vez más hacia entornos integrados como la Ultralytics , que agiliza la obtención de datos, la anotación automática y el entrenamiento de modelos en una sola interfaz.

Una vez anotados los datos, se hace referencia a ellos en un archivo de configuración (a menudo YAML) para el entrenamiento. El siguiente ejemplo muestra cómo entrenar un modelo YOLO26 utilizando el COCO8 estándar COCO8 , que viene con anotaciones preexistentes .

from ultralytics import YOLO

# Load the latest YOLO26 model (nano version)
model = YOLO("yolo26n.pt")

# Train the model using a dataset configuration file
# The YAML file points to the annotated images and labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora