Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Ultralytics YOLO

Exploración del etiquetado de datos para proyectos de visión artificial

Lee nuestro análisis exhaustivo sobre el etiquetado de datos en proyectos de visión artificial y aprende cómo etiquetar datos visuales y por qué es tan importante.

ABAbirami Vina
4 min read
Etiquetado de datos para proyectos de visión artificial

La inteligencia artificial (IA) se centra en proporcionar a las máquinas capacidades similares a las humanas, y una de las formas más populares de hacerlo es a través del aprendizaje supervisado. En otras palabras, enseñar a los modelos de IA mostrándoles ejemplos etiquetados puede ayudarles a aprender de los patrones y mejorar en las tareas. Es muy similar a cómo los humanos aprenden de la experiencia. Entonces, ¿cómo se crean estos ejemplos etiquetados?

La anotación de datos consiste en etiquetar o marcar datos para ayudar a los algoritmos de aprendizaje automático a comprenderlos. En visión artificial, esto significa marcar imágenes o vídeos para reconocer y categorizar con precisión objetos, acciones o escenas. El etiquetado de datos es vital porque el éxito de un modelo de IA depende en gran medida de la calidad de los datos etiquetados con los que se entrena.

Los estudios demuestran que más del 80% of AI project time se dedica a la gestión de datos, desde su recopilación y agregación hasta su limpieza y etiquetado. Esto muestra lo importante que es la anotación de datos en el desarrollo de modelos de IA. El uso de datos anotados de alta calidad permite que los modelos de IA realicen tareas como el reconocimiento facial y la detección de objetos con mayor precisión y fiabilidad en situaciones del mundo real.

Link to this sectionPor qué es necesaria la anotación de datos#

La anotación de datos constituye la base del rendimiento de un modelo de visión artificial. Los datos etiquetados son la verdad fundamental (ground truth) que el modelo utiliza para aprender y realizar predicciones. Los datos de verdad fundamental son clave porque representan el mundo real que el modelo intenta comprender. Sin esta base fiable, el modelo de IA sería como un barco navegando sin brújula.

Verdad de terreno frente a predicción

Fig 1. Verdad fundamental frente a predicción.

Un etiquetado preciso ayuda a estos modelos a entender lo que ven y conduce a una mejor toma de decisiones. Si los datos están mal etiquetados o son incoherentes, al modelo le costará realizar predicciones y decisiones correctas, igual que a un estudiante que aprende con libros de texto incorrectos. Gracias a los datos anotados, un modelo puede aprender tareas como la clasificación de imágenes, la segmentación de instancias y la estimación de poses de objetos en imágenes y vídeos.

Link to this sectionMejores recursos para conjuntos de datos#

Antes de crear un conjunto de datos desde cero y etiquetar minuciosamente imágenes y vídeos, es una buena idea ver si puedes utilizar conjuntos de datos preexistentes para tu proyecto. Existen varios repositorios de código abierto fantásticos donde puedes acceder a conjuntos de datos de alta calidad de forma gratuita. Algunos de los más populares incluyen:

  • ImageNet: se utiliza habitualmente para entrenar modelos de clasificación de imágenes.
  • COCO: este conjunto de datos está diseñado para la detección de objetos, segmentación y subtitulado de imágenes.
  • PASCAL VOC: es compatible con tareas de detección de objetos y segmentación.

Ejemplos de datos en el dataset COCO

Fig 2. Ejemplos de datos en el conjunto de datos COCO.

Al elegir un conjunto de datos, es importante tener en cuenta factores como lo bien que se ajusta a tu proyecto, el tamaño del conjunto de datos, su diversidad y la calidad de las etiquetas. Además, asegúrate de revisar los términos de licencia del conjunto de datos para evitar cualquier repercusión legal, y comprueba si los datos tienen un formato que se adapte a tu flujo de trabajo y herramientas.

Crear un conjunto de datos personalizado es una gran opción si los conjuntos de datos existentes no se ajustan exactamente a tus necesidades. Puedes reunir imágenes utilizando herramientas como cámaras web, drones o teléfonos inteligentes, dependiendo de lo que requiera tu proyecto. Lo ideal es que tu conjunto de datos personalizado sea diverso, equilibrado y verdaderamente representativo del problema que intentas resolver. Esto podría significar capturar imágenes en diferentes condiciones de iluminación, desde varios ángulos y a través de múltiples entornos.

Si solo puedes recopilar un número menor de imágenes o vídeos, la aumentación de datos es una técnica útil. Consiste en ampliar tu conjunto de datos aplicando transformaciones como rotación, inversión o ajustes de color a las imágenes existentes. Aumenta el tamaño de tu conjunto de datos y hace que tu modelo sea más robusto y capaz de manejar variaciones en los datos. Al utilizar una combinación de conjuntos de datos de código abierto, conjuntos de datos personalizados y datos aumentados, puedes aumentar significativamente el rendimiento de tus modelos de visión artificial.

Link to this sectionTipos de técnicas de anotación de imágenes#

Antes de empezar a anotar imágenes, es importante conocer los diferentes tipos de anotaciones. Te ayudará a elegir la adecuada para tu proyecto. A continuación, veremos algunos de los principales tipos de anotaciones.

Link to this sectionBBox#

Las Bounding boxes son el tipo de anotación más común en visión artificial. Son cajas rectangulares que se utilizan para marcar la ubicación de un objeto en una imagen. Estas cajas están definidas por las coordenadas de sus esquinas y ayudan a los modelos de IA a identificar y localizar objetos. Las Bounding boxes se utilizan principalmente para la detección de objetos.

Un ejemplo de bounding boxes

Fig 3. Un ejemplo de Bounding boxes.

Link to this sectionMáscaras de segmentación#

A veces, un objeto debe detectarse con mayor precisión que mediante una simple Bounding box dibujada a su alrededor. Es posible que te interese el contorno de los objetos en una imagen. En ese caso, las máscaras de segmentación te permiten perfilar objetos complejos. Las máscaras de segmentación son una representación más detallada a nivel de píxel.

Estas máscaras pueden utilizarse para la segmentación semántica y la segmentación de instancias. La segmentación semántica implica etiquetar cada píxel de una imagen según el objeto o área que representa, como un peatón, un coche, una carretera o una acera. La segmentación de instancias, sin embargo, va un paso más allá al identificar y separar cada objeto individualmente, como distinguir entre cada coche en una imagen, incluso si son todos del mismo tipo.

Un ejemplo de segmentación semántica (izquierda) y segmentación de instancias (derecha)

Fig 4. Un ejemplo de segmentación semántica (izquierda) y máscaras de segmentación de instancias (derecha).

Link to this sectionCuboides 3D#

Los cuboides 3D son similares a las Bounding boxes; lo que los hace únicos es que añaden información de profundidad y proporcionan una representación en 3D de un objeto. Esta información adicional permite a los sistemas comprender la forma, el volumen y la posición de los objetos en un espacio 3D. Los cuboides 3D se utilizan a menudo en coches autónomos para medir la distancia de los objetos respecto al vehículo.

Un ejemplo de cuboides 3D

Fig 5. Un ejemplo de cuboides 3D.

Link to this sectionPuntos clave y puntos de referencia (landmarks)#

Otro tipo interesante de anotación son los puntos clave, donde se marcan puntos específicos como ojos, narices o articulaciones en los objetos. Los puntos de referencia (landmarks) van un paso más allá al conectar estos puntos para capturar la estructura y el movimiento de formas más complejas, como rostros o poses corporales. Estos tipos de anotaciones se utilizan para aplicaciones como el reconocimiento facial, la captura de movimiento y la realidad aumentada. También mejoran la precisión de los modelos de IA en tareas como el reconocimiento de gestos o el análisis del rendimiento deportivo.

Un ejemplo de puntos clave

Fig 6. Un ejemplo de puntos clave.

Link to this sectionCómo anotar datos usando LabelImg#

Ahora que hemos analizado los diferentes tipos de anotaciones, entendamos cómo puedes anotar imágenes utilizando una herramienta popular, LabelImg. LabelImg es una herramienta de código abierto que simplifica la anotación de imágenes y puede utilizarse para crear conjuntos de datos en el formato YOLO (You Only Look Once). Es una gran elección para principiantes que trabajan en pequeños proyectos de Ultralytics YOLOv8.

Configurar LabelImg es sencillo. Primero, asegúrate de tener Python 3 instalado en tu equipo. Después, puedes instalar LabelImg con un comando rápido:

pip3 install labelImg

Una vez instalado, puedes iniciar la herramienta usando el comando:

labelImg

LabelImg funciona en múltiples plataformas, incluyendo Windows, macOS y Linux. Si encuentras algún problema durante la instalación, el repositorio oficial de LabelImg puede proporcionarte instrucciones más detalladas.

Usando LabelImg para la anotación de imágenes

Fig 7. Uso de LabelImg para la anotación de imágenes.

Una vez que inicies la herramienta, sigue estos sencillos pasos para empezar a etiquetar tus imágenes:

  • Configura tus clases: Comienza definiendo la lista de clases (categorías) que deseas anotar en un archivo llamado “predefined_classes.txt.” Este archivo permite al software saber qué objetos estarás etiquetando en tus imágenes.
  • Cambia al formato YOLO: Por defecto, LabelImg utiliza el formato PASCAL VOC, pero si trabajas con YOLO, necesitarás cambiar el formato. Simplemente haz clic en el botón “PascalVOC” de la barra de herramientas para cambiar a YOLO.
  • Empieza a anotar: Utiliza las opciones “Open” o “OpenDIR” para cargar tus imágenes. Luego, dibuja Bounding boxes alrededor de los objetos que deseas anotar y asigna la etiqueta de clase correcta. Después de etiquetar cada imagen, guarda tu trabajo. LabelImg creará un archivo de texto con el mismo nombre que tu imagen, que contendrá las anotaciones en formato YOLO.
  • Guarda y revisa: Las anotaciones se guardan en un archivo .txt en el formato YOLO. El software también guarda un archivo “classes.txt” que enumera todos los nombres de tus clases.

Link to this sectionEstrategias eficientes de etiquetado de datos#

Para que el proceso de etiquetado de datos sea más fluido, hay algunas estrategias clave que debes tener en cuenta. Por ejemplo, contar con directrices de anotación claras es crucial. Sin ellas, diferentes anotadores podrían interpretar una tarea de formas distintas.

Supongamos que la tarea es anotar pájaros en imágenes con Bounding boxes. Un anotador podría etiquetar al pájaro completo, mientras que otro podría etiquetar solo la cabeza o las alas. Este tipo de incoherencia puede confundir al modelo durante el entrenamiento. Al proporcionar definiciones claras, como “etiqueta al pájaro completo, incluyendo alas y cola”, junto con ejemplos e instrucciones para casos difíciles, puedes asegurarte de que los datos se etiqueten de forma precisa y coherente.

Los controles de calidad regulares también son importantes para mantener estándares elevados. Al establecer puntos de referencia y utilizar métricas específicas para revisar el trabajo, puedes mantener la precisión de los datos y refinar el proceso mediante una retroalimentación continua.

Link to this sectionEl etiquetado de datos en pocas palabras#

La anotación de datos es un concepto sencillo que puede tener un impacto significativo en tu modelo de visión artificial. Tanto si utilizas herramientas como LabelImg para anotar imágenes como si entrenas modelos en conjuntos de datos de código abierto, comprender el etiquetado de datos es clave. Las estrategias de etiquetado de datos pueden ayudar a optimizar todo el proceso y hacerlo más eficiente. Dedicar tiempo a refinar tu enfoque de anotación puede conducir a mejores resultados de IA, más fiables.

¡Sigue explorando y ampliando tus habilidades! ¡Mantente conectado con nuestra comunidad para seguir aprendiendo sobre IA! Echa un vistazo a nuestro repositorio de GitHub para descubrir cómo estamos utilizando la IA para crear soluciones innovadoras en sectores como la fabricación y la sanidad. 🚀

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático