Glosario

Aumento de datos

Mejora tus modelos de aprendizaje automático con el aumento de datos. Descubre técnicas para aumentar la precisión, reducir el sobreajuste y mejorar la solidez.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El aumento de datos es una técnica crucial en el aprendizaje automático (AM) que se utiliza para ampliar artificialmente el tamaño y la diversidad de un conjunto de datos de entrenamiento. Esto se consigue creando versiones modificadas de puntos de datos existentes o generando nuevos ejemplos sintéticos basados en ellos. El objetivo principal es mejorar el rendimiento, la capacidad de generalización y la solidez de los modelos de ML, especialmente en dominios como la visión por ordenador (VC), donde adquirir conjuntos de datos grandes y variados puede ser costoso y llevar mucho tiempo. Entrenando modelos como Ultralytics YOLO en datos aumentados, los desarrolladores pueden ayudarles a aprender a manejar una gama más amplia de variaciones encontradas en escenarios del mundo real, lo que conduce a una mayor precisión en datos no vistos.

Cómo funciona el aumento de datos

La idea central del aumento de datos es aplicar diversas transformaciones a las muestras de datos originales para generar nuevos ejemplos de entrenamiento plausibles. Lo ideal es que estas transformaciones reflejen las variaciones que el modelo podría encontrar durante la inferencia. En el caso de los datos de imágenes, que son un objetivo primordial en la visión por ordenador, las técnicas habituales de aumento incluyen:

  • Transformaciones geométricas: Alteración de las propiedades espaciales de la imagen, como rotación, escalado (acercamiento o alejamiento), traslación (desplazamiento), cizallamiento y volteo (horizontal o vertical).
  • Transformaciones del Espacio de Color: Modificación de las características del color, incluidos los ajustes de brillo, contraste, saturación y tono. Esto ayuda a que los modelos sean menos sensibles a las condiciones de iluminación y a las variaciones de la cámara.
  • Añadir ruido: Introducir ruido aleatorio (como el ruido gaussiano) para simular el ruido del sensor o una calidad de imagen imperfecta.
  • Borrado aleatorio / Recorte: Enmascarar regiones rectangulares aleatorias de una imagen para animar al modelo a centrarse en diferentes partes de los objetos y mejorar la solidez frente a la oclusión.
  • Mezclar imágenes: Combinar varias imágenes o partes de imágenes. Técnicas como Mixup (interpolar entre dos imágenes y sus etiquetas) y CutMix (pegar un fragmento de una imagen en otra) obligan al modelo a aprender de ejemplos menos limpios.

Aunque se utilizan mucho en CV, las técnicas de aumento también se aplican en otros campos. Por ejemplo, en el Procesamiento del Lenguaje Natural (PLN), métodos como la sustitución de sinónimos, la retrotraducción (traducir el texto a otro idioma y viceversa) y la inserción/eliminación aleatoria de palabras pueden aumentar los datos textuales.

Importancia y beneficios

El aumento de datos es una parte fundamental del flujo de trabajo del ML por varias razones:

  • Generalización mejorada del modelo: Al exponer el modelo a ejemplos más diversos, la ampliación le ayuda a aprender patrones subyacentes en lugar de memorizar ejemplos de entrenamiento específicos, lo que da lugar a un mejor rendimiento con datos nuevos.
  • Reducción del sobreajuste: El sobreajuste se produce cuando un modelo funciona bien con los datos de entrenamiento, pero mal con los datos no vistos. El aumento actúa como una técnica de regularización, dificultando que el modelo se ajuste en exceso al limitado conjunto de datos original.
  • Mayor robustez: Los modelos entrenados con datos aumentados suelen ser más resistentes a las variaciones de entrada, como los cambios de iluminación, punto de vista, escala u oclusiones parciales.
  • Reducción de las necesidades de recogida de datos: Permite a los desarrolladores obtener mejores resultados con conjuntos de datos iniciales más pequeños, ahorrando tiempo y recursos asociados a la recogida y etiquetado de datos. Encuentra más consejos para el entrenamiento de modelos en nuestra documentación.

Técnicas y herramientas

La implementación del aumento de datos se ve facilitada por diversas bibliotecas y marcos de trabajo. Para las tareas de visión por ordenador, algunas herramientas populares son:

Los modelos de Ultralytics incorporan varias técnicas eficaces de aumento durante el entrenamiento. Los usuarios pueden gestionar sus conjuntos de datos y aprovechar estas funciones a través de plataformas como Ultralytics HUB.

Aplicaciones en el mundo real

El aumento de datos se aplica ampliamente en numerosos ámbitos de la IA:

  1. La IA en la Sanidad: En el análisis de imágenes médicas, como la detección de tumores en escáneres, los conjuntos de datos suelen ser limitados debido a cuestiones de privacidad y a la rareza de ciertas afecciones. Las técnicas de aumento, como los ajustes de rotación, escala y brillo, crean diversos ejemplos de entrenamiento, lo que ayuda a los modelos a detectar anomalías de forma fiable a pesar de las variaciones en el equipo de obtención de imágenes o en la posición del paciente. Esto mejora la precisión diagnóstica de los sistemas de análisis de imágenes médicas.
  2. IA para automoción: El desarrollo de sistemas robustos de detección de objetos para vehículos autónomos requiere datos de entrenamiento que abarquen diversos escenarios de conducción. El aumento simula diferentes condiciones meteorológicas (por ejemplo, añadiendo lluvia sintética o niebla), variaciones de iluminación (día, noche, amanecer/atardecer) y oclusiones (por ejemplo, peatones o vehículos parcialmente ocultos), haciendo que los sistemas de percepción sean más fiables en entornos impredecibles del mundo real.
  3. IA en la agricultura: Para tareas como la detección de enfermedades en los cultivos o el recuento de frutos, el aumento puede simular variaciones en la iluminación debidas al clima o a la hora del día, diferentes etapas de crecimiento o ángulos de cámara de drones o robots terrestres, lo que conduce a soluciones de agricultura de precisión más sólidas.
  4. IA en la fabricación: En el control de calidad, el aumento puede crear variaciones en la orientación del producto, la iluminación y defectos menores para entrenar modelos que permitan una detección de anomalías más fiable en las líneas de producción.

Aumento de Datos vs. Datos Sintéticos

Aunque tanto el aumento de datos como la generación de datos sintéticos tienen como objetivo mejorar los conjuntos de datos de entrenamiento, difieren fundamentalmente:

  • Aumento de datos: Modifica los datos reales existentes mediante transformaciones. Aumenta la varianza en torno a los puntos de datos observados, pero generalmente no introduce escenarios totalmente nuevos no representados en los datos originales.
  • Datos sintéticos: Consiste en crear datos artificiales totalmente nuevos a partir de cero, a menudo utilizando simulaciones, gráficos por ordenador o modelos generativos como las Redes Generativas Adversariales (GAN) o los modelos de difusión. Los datos sintéticos pueden representar escenarios que son raros o imposibles de capturar en el mundo real, llenando potencialmente lagunas que el aumento no puede abordar.

En la práctica, el aumento de datos suele ser más fácil de aplicar y más barato computacionalmente que la generación de datos sintéticos de alta fidelidad. Ambas técnicas pueden ser valiosas, y a veces se utilizan combinadas para crear conjuntos de datos de entrenamiento muy diversos y robustos para aplicaciones de IA exigentes.

Leer todo