Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Anotación de datos

¿Qué es la anotación de datos? Aprenda cómo el etiquetado de datos con bounding boxes o polígonos es esencial para entrenar modelos de IA y visión artificial precisos.

La anotación de datos es el proceso de etiquetado o transcripción de datos brutos para proporcionar un contexto que un modelo de aprendizaje automático pueda comprender. que un modelo de aprendizaje automático pueda entender. Este paso es fundamental para aprendizaje supervisado, en el que los algoritmos ejemplos etiquetados para aprender patrones y hacer predicciones. Los datos anotados sirven de representan la respuesta "correcta" que el modelo que el modelo intenta replicar durante el entrenamiento. Sin una anotación precisa, incluso las arquitecturas más sofisticadas como Ultralytics YOLO11 no pueden funcionar eficazmente, ya que el modelo está intrínsecamente ligado a la calidad de sus datos de datos de entrenamiento.

El papel de la anotación en la visión artificial

En el campo de la visión por ordenador (VC), la consiste en marcar características específicas en imágenes o fotogramas de vídeo. Diferentes tareas requieren distintos estilos de anotación, cada uno de los cuales aporta un nivel de detalle único al sistema.

  • Detección de objetos: Anotadores dibujan recuadros delimitadores 2D alrededor de los objetos de interés, como coches o peatones. Esto enseña al modelo qué es un objeto y dónde se encuentra.
  • Segmentación de instancias: Esta técnica requiere trazar polígonos precisos alrededor de los objetos. A diferencia de los recuadros delimitadores, la segmentación mapea la forma y el contorno exactos de una entidad. forma y el contorno exactos de una entidad, lo que es crucial para el agarre robótico.
  • Estimación de poses: Los anotadores marcan "puntos clave" de un sujeto, como las articulaciones de un cuerpo humano (codos, rodillas, hombros). Esto permite track movimiento y la postura.
  • Cajas delimitadoras orientadas (OBB): Se utilizan para objetos que no están alineados con el eje de la imagen, como barcos en imágenes por satélite o paquetes en una cinta transportadora. Estas cajas pueden girar para adaptarse a la orientación del objeto.
  • Clasificación de imágenes: La forma más sencilla de anotación, en la que se asigna una única etiqueta (por ejemplo, "soleado", "lluvioso") a toda una imagen. imagen.

Las anotaciones suelen guardarse en formatos estructurados como JSON, XML o archivos de texto simple (por ejemplo, el formato YOLO ), que luego son analizados por el software de formación. software de formación.

Aplicaciones en el mundo real

La anotación de datos impulsa innumerables tecnologías modernas al salvar la brecha entre los sensores en bruto y la toma de decisiones inteligentes. la toma de decisiones.

  1. Vehículos autónomos: Los coches autónomos dependen de conjuntos de datos masivos en los que se anota cada marcador de carril, señal de tráfico y obstáculo. Los datos de cámaras y sensores LiDAR se etiquetan para entrenar el sistema de sistema de percepción del vehículo para navegar con seguridad. Este nivel de detalle es fundamental para desarrollar soluciones de IA en automoción.
  2. Diagnóstico médico: En AI en sanidad, los radiólogos anotan resonancias magnéticas o o radiografías para resaltar tumores y fracturas. Estas imágenes médicas anotadas permiten a los modelos ayudar a los médicos señalando posibles anomalías con gran sensibilidad.
  3. Comercio inteligente: Los sistemas de caja automatizados utilizan anotaciones para reconocer los productos. Al etiquetar miles de artículos de alimentación, los sistemas pueden facilitar experiencias de compra fluidas. Más información sobre La IA en el comercio minorista.

Comparación con conceptos relacionados

Resulta útil distinguir la anotación de datos de otros términos utilizados a menudo en el flujo de trabajo de preparación de datos.

  • Anotación vs. Etiquetado de datos: Estos términos suelen utilizarse indistintamente. Sin embargo, "etiquetado" se asocia con frecuencia a tareas sencillas de clasificación (asignación de una categoría), mientras que "anotación" implica metadatos más complejos. tareas de clasificación sencillas (asignar una categoría), mientras que "anotación" suele implicar una generación de metadatos más compleja, como dibujar geometría (polígonos, cuadros) o marcar marcas de tiempo en vídeo. más complejos, como dibujar geometría (polígonos, recuadros) o marcar marcas de tiempo en un vídeo.
  • Anotación frente a aumento de datos: La anotación crea las etiquetas iniciales de un conjunto de datos. La ampliación de datos es un proceso independiente que artificialmente este conjunto de datos modificando las imágenes anotadas existentes (por ejemplo, volteándolas, rotándolas o cambiando su brillo) para mejorar la solidez del modelo. para mejorar la solidez del modelo.
  • Anotación frente a aprendizaje activo: El aprendizaje activo es una estrategia en la que el modelo identifica los puntos de datos en los que está más confuso y solicita la anotación humana sólo para esos ejemplos específicos, optimizando el presupuesto de anotación.

Herramientas y flujo de trabajo

La creación de anotaciones de alta calidad suele requerir herramientas especializadas. Opciones de código abierto como CVAT (Computer Vision Annotation Tool) y Label Studio ofrecen interfaces para dibujar recuadros y polígonos. Para operaciones a gran escala a gran escala, los equipos pueden pasar a entornos integrados como Ultralytics Platform, que agiliza el ciclo de desde la obtención de datos hasta la implantación de modelos.

Una vez anotados los datos, pueden utilizarse para entrenar un modelo. El siguiente ejemplo muestra cómo entrenar un modelo YOLO11 utilizando un conjunto de datos definido en un archivo YAML, que apunta a las imágenes y etiquetas anotadas.

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")

# Train on the COCO8 dataset, which contains pre-annotated images
# The 'data' argument references a YAML file defining dataset paths and classes
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora