Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Etiquetado de Datos

Descubra el papel fundamental del etiquetado de datos en el aprendizaje automático, su proceso, sus retos y sus aplicaciones en el mundo real en el desarrollo de la IA.

El etiquetado de datos es el proceso fundamental de etiquetado o anotación de datos brutos con un contexto significativo para crear un conjunto de datos adecuado para entrenar modelos de aprendizaje automático. En el contexto del aprendizaje supervisado, los algoritmos necesitan ejemplos que incluyan tanto los datos de entrada (como una imagen) como el resultado esperado (la etiqueta). Esta información Esta información etiquetada sirve como verdad de base, actuando como el estándar definitivo con el que se comparan los resultados del modelo. norma definitiva con la que se miden y mejoran las predicciones del modelo. Sin un etiquetado de calidad, incluso las arquitecturas más sofisticadas, como Ultralytics YOLO11no pueden aprender a reconocer patrones o identificar objetos.

La importancia de un etiquetado preciso

El rendimiento de cualquier sistema de IA está inextricablemente ligado a la calidad de sus datos de entrenamiento. datos de entrenamiento. Si las etiquetas son incoherentes, imprecisas o incorrectas, el modelo aprenderá asociaciones erróneas. "basura dentro, basura fuera". Un etiquetado preciso permite a los modelos generalizar bien a datos nuevos y no vistos, lo que es para el despliegue de aplicaciones aplicaciones de visión por ordenador (VC ). Los principales conjuntos de datos de referencia de referencia como el conjunto de datos COCO y ImageNet se convirtieron en estándares del sector por su exhaustivo y cuidadoso etiquetado.

Tipos comunes de etiquetado en visión por ordenador

El método específico de etiquetado de datos depende en gran medida de la tarea de visión por ordenador prevista:

  • Clasificación de imágenes: Asignación de una única categoría o etiqueta de clase a toda una imagen (por ejemplo, etiquetar una foto como "soleada" o "lluviosa").
  • Detección de objetos: Dibujo en 2D alrededor de los objetos de interés y asignar una clase a cada caja. Esto enseña al modelo qué es el objeto y dónde se encuentra.
  • Segmentación de imágenes: Creación de máscaras de píxeles perfectos. La segmentación semántica etiqueta las regiones por categoría (por ejemplo, todos los píxeles de "carretera"), mientras que la segmentación por instancias distingue entre objetos individuales de la misma clase (por ejemplo, "coche 1", "coche 2").
  • Estimación de poses: Anotación puntos clave específicos de un sujeto, como las articulaciones un cuerpo humano (seguimiento del esqueleto), para comprender el movimiento y la postura.

Aplicaciones en el mundo real

El etiquetado de datos permite a la IA funcionar en entornos complejos del mundo real. Dos ejemplos destacados son:

  1. Vehículos autónomos: Para que un coche autónomo navegue con seguridad, se basa en datos de entrenamiento en los que los humanos han etiquetado meticulosamente las líneas de carril señales de tráfico, peatones y otros vehículos. Esto permite al sistema de percepción del coche interpretar la geometría de la carretera y los peligros potenciales al instante. la geometría de la carretera y los peligros potenciales al instante. Puede profundizar en este tema en nuestras Soluciones de IA en automoción.
  2. Análisis de imágenes médicas: En sanidad, los radiólogos etiquetan las exploraciones médicas para identificar anomalías. Por ejemplo, en un de datos de tumores cerebrales, los expertos los límites exactos de una lesión. Estos datos etiquetados entrenan modelos para ayudar a los médicos en el diagnóstico precoz, mejorando los resultados de los pacientes. los resultados de los pacientes. Más información sobre AI in Healthcare para ver estos modelos en acción.

Etiquetado de datos vs. Conceptos relacionados

Resulta útil distinguir el etiquetado de términos similares utilizados en el proceso de preparación de datos:

  • Vs. Anotación de datos: Estos términos suelen utilizarse indistintamente. Sin embargo, "etiquetado" se reserva a veces para tareas más sencillas como clasificación (etiquetado), mientras que "anotación" implica metadatos más ricos, como dibujar polígonos o trazar puntos clave.
  • Vs. Aumento de datos: El etiquetado crea el conjunto de datos inicial. El aumento se produce después, cuando el software altera matemáticamente las imágenes las imágenes etiquetadas (girándolas, volteándolas, añadiendo ruido) para aumentar artificialmente la diversidad del conjunto de datos sin esfuerzo humano.
  • Vs. Limpieza de datos: Se trata de corregir errores en el conjunto de datos, como eliminar archivos dañados o corregir elementos mal etiquetados. La limpieza garantiza la integridad de las etiquetas proporcionadas por los anotadores.

Herramientas y ejemplo de código

Aunque el etiquetado manual lleva mucho tiempo, los flujos de trabajo modernos suelen utilizar software especializado como CVAT (Computer Vision Annotation Tool) o aprovechan el aprendizaje activo para acelerar el proceso. La plataforma Ultralytics plataformaUltralytics se ha diseñado para agilizar todo este desde la obtención de datos hasta la anotación automática.

El siguiente fragmento de Python muestra cómo entrenar un modelo YOLO11 utilizando un conjunto de datos preetiquetados (coco8.yaml). El proceso de entrenamiento depende por completo de la existencia de etiquetas precisas definidas en el archivo de configuración del conjunto de datos. archivo de configuración del conjunto de datos.

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
# The dataset YAML file contains paths to images and their corresponding labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

# The model updates its weights based on the labeled data provided

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora