Aumento de datos
Mejora tus modelos de aprendizaje automático con el aumento de datos. Descubre técnicas para aumentar la precisión, reducir el sobreajuste y mejorar la solidez.
El aumento de datos es una técnica fundamental en el aprendizaje automático (ML) que se utiliza para aumentar artificialmente el tamaño y la diversidad de un conjunto de datos de entrenamiento. Esto se logra creando versiones modificadas, pero realistas, de las muestras de datos existentes. El objetivo principal es mejorar el rendimiento y la robustez de los modelos de IA, particularmente en la visión artificial (CV), exponiéndolos a una variedad más amplia de condiciones durante el entrenamiento. Esto ayuda a prevenir el sobreajuste, donde un modelo aprende demasiado bien los datos de entrenamiento, pero no logra generalizar a datos nuevos e invisibles, lo que en última instancia conduce a una mayor precisión del modelo.
¿Cómo funciona el aumento de datos?
En visión artificial, el aumento de datos implica aplicar una serie de transformaciones a las imágenes. Estas transformaciones están diseñadas para simular las variaciones del mundo real que un modelo podría encontrar después del despliegue. Las técnicas comunes incluyen:
- Transformaciones Geométricas: Estas alteran la orientación espacial de una imagen. Algunos ejemplos incluyen rotaciones aleatorias, escalado, traslaciones (desplazamiento), recorte e inversión (horizontal o vertical). Estas transformaciones enseñan al modelo a ser invariante a la posición y orientación del objeto.
- Transformaciones del Espacio de Color: Estas modifican las propiedades del color de una imagen. Los ajustes de brillo, contraste, saturación y tono hacen que el modelo sea más resistente a los cambios en las condiciones de iluminación.
- Técnicas avanzadas: Los métodos más complejos implican alterar el contenido de la imagen de forma más significativa. Estos pueden incluir la adición de ruido aleatorio (como el ruido gaussiano), la aplicación de efectos de desenfoque o el uso de métodos como Mixup, que crea nuevas imágenes combinando linealmente dos existentes, y Cutout, que elimina aleatoriamente regiones de una imagen. Puede obtener más información sobre estos métodos en La guía definitiva para el aumento de datos.
Muchos frameworks de deep learning, como PyTorch y TensorFlow, proporcionan herramientas para la aumentación de datos. Librerías especializadas como Albumentations ofrecen una vasta colección de técnicas de aumentación de alto rendimiento y están integradas con modelos como Ultralytics YOLO11 para diversificar los datos de entrenamiento sin problemas.
Aplicaciones en el mundo real
El aumento de datos es una práctica estándar en muchos dominios para construir sistemas de IA más fiables.
- IA en el sector salud: En el análisis de imágenes médicas, los conjuntos de datos suelen ser pequeños debido a las regulaciones de privacidad del paciente y la rareza de ciertas enfermedades. Para entrenar un modelo para la detección de tumores en escaneos, las técnicas de aumento como la rotación, el escalado y los cambios de brillo crean un conjunto más diverso de ejemplos de entrenamiento. Esto ayuda al modelo a identificar con precisión las anomalías, independientemente de las variaciones en el equipo de imagen o el posicionamiento del paciente, mejorando la fiabilidad del diagnóstico.
- IA para Automoción: El desarrollo de sistemas robustos de detección de objetos para vehículos autónomos requiere datos de innumerables escenarios de conducción. En lugar de recopilar datos para cada condición posible, la aumentación puede simular diferentes condiciones meteorológicas (por ejemplo, añadiendo lluvia o nieve sintéticas), iluminación (día, atardecer, noche) y oclusiones (por ejemplo, un peatón parcialmente oculto por otro coche). Esto hace que el sistema de percepción del vehículo sea más fiable en entornos impredecibles del mundo real.
Otras aplicaciones significativas incluyen la IA en la fabricación para el control de calidad y la IA en la agricultura para la detección de enfermedades de los cultivos en diversas condiciones de campo.
Aumento de datos vs. Conceptos relacionados
Es importante distinguir el aumento de datos de otras técnicas relacionadas con los datos.
- Datos Sintéticos: Si bien ambos métodos mejoran los conjuntos de datos, operan de manera diferente. El aumento de datos modifica los datos reales existentes. En contraste, la generación de datos sintéticos crea datos artificiales completamente nuevos desde cero utilizando simulaciones o modelos generativos como GANs. Mientras que el aumento expande la varianza alrededor de los datos observados, los datos sintéticos pueden crear escenarios novedosos no presentes en el conjunto de datos original, un concepto explorado en esta visión general de los datos sintéticos en la visión artificial.
- Limpieza de Datos: La limpieza de datos es una parte del preprocesamiento de datos más amplio que se centra en identificar y corregir errores, inconsistencias e inexactitudes en un conjunto de datos. Su objetivo es mejorar la calidad de los datos. El aumento de datos, por otro lado, se trata de aumentar la cantidad y la variedad de los datos. Un conjunto de datos limpio es el punto de partida ideal antes de aplicar el aumento.
- Aprendizaje por Transferencia: Esta técnica implica el uso de un modelo pre-entrenado en un gran conjunto de datos de referencia como ImageNet y luego ajustarlo en un conjunto de datos más pequeño y específico para la tarea. El aumento de datos se utiliza a menudo durante la etapa de ajuste fino para mejorar aún más el rendimiento y evitar el sobreajuste en los nuevos datos.
Plataformas como Ultralytics HUB optimizan todo el proceso de entrenamiento de modelos, incorporando el aumento de datos como un paso clave para ayudar a los usuarios a construir modelos de visión artificial potentes y de última generación.