Aumento de datos
Mejore sus modelos de aprendizaje automático con el aumento de datos. Descubra técnicas para aumentar la precisión, reducir el sobreajuste y mejorar la solidez.
El aumento de datos es una técnica fundamental en el aprendizaje automático (AM) que se utiliza para incrementar artificialmente el tamaño y la diversidad de un conjunto de datos de entrenamiento. Esto se consigue creando versiones modificadas, aunque realistas, de muestras de datos existentes. El objetivo principal es mejorar el rendimiento y la solidez de los modelos de IA, especialmente en visión por ordenador (CV), exponiéndolos a una mayor variedad de condiciones durante el entrenamiento. Esto ayuda a evitar la sobreadaptación, cuando un modelo aprende los datos de entrenamiento demasiado bien pero no consigue generalizarlos a datos nuevos no vistos, lo que en última instancia conduce a una mayor precisión del modelo.
Cómo funciona la ampliación de datos
En visión por ordenador, el aumento de datos consiste en aplicar una serie de transformaciones a las imágenes. Estas transformaciones están diseñadas para simular las variaciones del mundo real que un modelo podría encontrar tras su despliegue. Las técnicas más comunes son:
- Transformaciones geométricas: Alteran la orientación espacial de una imagen. Algunos ejemplos son las rotaciones aleatorias, el escalado, las traslaciones (desplazamientos), los recortes y los volteos (horizontales o verticales). Estas transformaciones enseñan al modelo a ser invariante con respecto a la posición y orientación del objeto.
- Transformaciones del espacio de color: Modifican las propiedades de color de una imagen. Los ajustes de brillo, contraste, saturación y tono hacen que el modelo sea más resistente a los cambios en las condiciones de iluminación.
- Técnicas avanzadas: Los métodos más complejos implican alterar el contenido de la imagen de forma más significativa. Pueden incluir la adición de ruido aleatorio (como el ruido gaussiano), la aplicación de efectos de desenfoque o el uso de métodos como Mixup, que crea nuevas imágenes combinando linealmente dos existentes, y Cutout, que elimina aleatoriamente regiones de una imagen. Puede obtener más información sobre estos métodos en The Ultimate Guide to Data Augmentation.
Muchos marcos de aprendizaje profundo, como PyTorch y TensorFlow, proporcionan herramientas para el aumento de datos. Bibliotecas especializadas como Albumentations ofrecen una amplia colección de técnicas de aumento de alto rendimiento y se integran con modelos como Ultralytics YOLO11 para diversificar los datos de entrenamiento sin problemas.
Aplicaciones reales
El aumento de datos es una práctica habitual en muchos ámbitos para crear sistemas de IA más fiables.
- La IA en la sanidad: En el análisis de imágenes médicas, los conjuntos de datos suelen ser pequeños debido a la normativa sobre privacidad de los pacientes y a la rareza de ciertas enfermedades. Para entrenar un modelo de detección de tumores en exploraciones, las técnicas de aumento como la rotación, el escalado y los cambios de brillo crean un conjunto más diverso de ejemplos de entrenamiento. Esto ayuda al modelo a identificar con precisión las anomalías independientemente de las variaciones en el equipo de obtención de imágenes o la posición del paciente, lo que mejora la fiabilidad del diagnóstico.
- IA para automoción: El desarrollo de sistemas sólidos de detección de objetos para vehículos autónomos requiere datos de innumerables escenarios de conducción. En lugar de recoger datos de todas las condiciones posibles, el aumento puede simular diferentes condiciones meteorológicas (por ejemplo, añadiendo lluvia o nieve sintéticas), iluminación (día, atardecer, noche) y oclusiones (por ejemplo, un peatón parcialmente oculto por otro coche). De este modo, el sistema de percepción del vehículo es más fiable en entornos reales impredecibles.
Otras aplicaciones importantes son la IA en la industria manufacturera para el control de calidad y la IA en la agricultura para detectar enfermedades de los cultivos en condiciones de campo variables.
Aumento de datos frente a conceptos relacionados
Es importante distinguir el aumento de datos de otras técnicas relacionadas con los datos.
- Datos sintéticos: Aunque ambos métodos mejoran los conjuntos de datos, su funcionamiento es diferente. El aumento de datos modifica los datos reales existentes. En cambio, la generación de datos sintéticos crea datos artificiales totalmente nuevos a partir de cero mediante simulaciones o modelos generativos como los GAN. Mientras que el aumento amplía la varianza en torno a los datos observados, los datos sintéticos pueden crear escenarios novedosos que no están presentes en el conjunto de datos original, un concepto que se explora en esta visión general de los datos sintéticos en visión por ordenador.
- Limpieza de datos: La limpieza de datos forma parte de un proceso más amplio de preprocesamiento de datos que se centra en identificar y corregir errores, incoherencias e imprecisiones en un conjunto de datos. Su objetivo es mejorar la calidad de los datos. La ampliación de datos, por su parte, consiste en aumentar la cantidad y variedad de los datos. Un conjunto de datos limpio es el punto de partida ideal antes de aplicar la ampliación.
- Transferencia de aprendizaje: Esta técnica consiste en utilizar un modelo preentrenado en un gran conjunto de datos de referencia, como ImageNet, y luego perfeccionarlo en un conjunto de datos más pequeño y específico de la tarea. Durante la fase de ajuste se suele recurrir al aumento de datos para mejorar aún más el rendimiento y evitar el sobreajuste en los nuevos datos.
Plataformas como Ultralytics HUB agilizan todo el proceso de formación de modelos, incorporando el aumento de datos como paso clave para ayudar a los usuarios a crear modelos de IA de visión potentes y de última generación.