Anotación de datos
¿Qué es la anotación de datos? Descubra cómo etiquetar datos con cuadros delimitadores o polígonos es esencial para entrenar modelos precisos de IA y visión por ordenador.
La anotación de datos es el proceso de etiquetado de los datos brutos para ayudar a los modelos de aprendizaje automático a comprenderlos y aprender de ellos. Este paso fundamental transforma los datos no estructurados, como imágenes o vídeos, en información estructurada que los algoritmos pueden interpretar. En el contexto del aprendizaje supervisado, estas anotaciones sirven como "verdad fundamental", es decir, las respuestas correctas que el modelo utiliza para entrenarse. La calidad y la precisión de las anotaciones de datos influyen directamente en el rendimiento y la fiabilidad del modelo de inteligencia artificial (IA) resultante. Sin anotaciones precisas, ni siquiera los modelos más avanzados aprenderán patrones con eficacia.
El papel de la anotación en la visión por ordenador
En visión por ordenador (VC), la anotación de datos es fundamental para enseñar a los modelos a "ver" e interpretar el mundo. Consiste en que anotadores humanos utilicen software especializado para identificar y marcar objetos de interés dentro de los datos visuales. Existen varios tipos de anotación, cada uno de ellos adecuado para diferentes tareas de CV:
- Bounding Box Annotation: Esta es la forma más común, utilizada para la detección de objetos. Los anotadores dibujan recuadros rectangulares alrededor de objetos individuales y les asignan una etiqueta de clase (por ejemplo, "coche", "persona").
- Segmentación poligonal: Para tareas que requieren mayor precisión, como la segmentación de instancias, los anotadores trazan el contorno exacto de cada objeto. Esto permite al modelo comprender la forma y los límites específicos de un objeto, incluso cuando los objetos se superponen.
- Segmentación semántica: Este método consiste en clasificar cada píxel de una imagen en una categoría específica (por ejemplo, "cielo", "carretera", "edificio"). A diferencia de la segmentación por instancias, no distingue entre diferentes instancias de la misma clase de objeto.
- Anotación de puntos clave: Utilizada para la estimación de la pose, esta técnica consiste en marcar puntos de interés específicos (puntos clave) en un objeto, como las articulaciones de un cuerpo humano o las esquinas de una cara.
- Clasificación: La forma más sencilla, en la que a toda una imagen se le asigna una única etiqueta. Es fundamental para las tareas de clasificación de imágenes.
La elección del método de anotación depende de los objetivos específicos del proyecto de CV, que se describen en la guía para definir los objetivos del proyecto.
Aplicaciones reales
- Vehículos autónomos: Los coches autónomos se basan en modelos entrenados a partir de datos ampliamente anotados. Los anotadores lo etiquetan todo, desde peatones y ciclistas hasta semáforos, marcas viales y señales de tráfico en millones de imágenes y nubes de puntos LiDAR. Estos datos de entrenamiento detallados permiten al sistema de percepción del vehículo comprender su entorno y tomar decisiones de conducción seguras. Conjuntos de datos como Argoverse son cruciales para desarrollar soluciones sólidas de IA en automoción.
- Análisis de imágenes médicas: En el ámbito de la IA para la atención sanitaria, los radiólogos y expertos médicos anotan exploraciones médicas como resonancias magnéticas, tomografías computarizadas y radiografías para resaltar tumores, lesiones, fracturas u otras anomalías. Estos conjuntos de datos anotados, como el conjunto de datos público sobre tumores cerebrales, se utilizan para entrenar modelos como Ultralytics YOLO, que pueden ayudar en el diagnóstico precoz y la planificación del tratamiento. La Sociedad Radiológica de Norteamérica (RSNA ) proporciona varios conjuntos de datos de este tipo para la investigación.
Anotación de datos frente a conceptos relacionados
A menudo se habla de la anotación de datos junto con otras técnicas de preparación de datos, pero tienen fines distintos.
- Anotación de datos frente a etiquetado de datos: Estos dos términos suelen utilizarse indistintamente y se refieren al mismo proceso básico. El término "anotación" suele utilizarse en visión por ordenador para describir tareas más complejas, como dibujar polígonos o puntos clave, mientras que "etiquetado" puede emplearse para tareas más sencillas, como la clasificación. Sin embargo, a efectos prácticos, son sinónimos. Para obtener más información, consulte nuestro artículo sobre etiquetado de datos para visión por ordenador.
- Anotación de datos frente a aumento de datos: La anotación es el proceso de creación de las etiquetas iniciales. El aumento de datos, por su parte, es una técnica que se utiliza después de la anotación para aumentar artificialmente el tamaño del conjunto de datos creando versiones modificadas de las imágenes anotadas (por ejemplo, girando, volteando o cambiando el brillo).
- Anotación de datos frente a limpieza de datos: La limpieza de datos consiste en corregir errores, eliminar duplicados y tratar los valores que faltan en un conjunto de datos para garantizar su calidad general. La limpieza puede realizarse antes de la anotación (por ejemplo, eliminando imágenes borrosas) o después (por ejemplo, corrigiendo etiquetas incorrectas), pero es distinta del acto de añadir nuevas etiquetas. La calidad de los datos es esencial para una anotación eficaz.
El proceso de anotación puede gestionarse mediante diversas herramientas, desde opciones de código abierto como CVAT hasta plataformas comerciales como Scale AI y Labelbox. Plataformas como Ultralytics HUB ofrecen soluciones integradas para gestionar conjuntos de datos, entrenar modelos y agilizar todo el flujo de trabajo, desde la recopilación de datos y la anotación hasta la implantación.