Guías

La guía definitiva sobre aumentación de datos en 2025

Descubre cómo la aumentación de datos de imagen ayuda a los modelos de IA de visión a aprender mejor, mejorar la precisión y trabajar con mayor eficacia en situaciones reales.

ABAbirami Vina

6 min readFebruary 14, 2025

La aumentación de datos de imagen creando diversas variaciones para el entrenamiento de IA de visión

Debido al auge de la IA, fenómenos como robots trabajando en fábricas y coches autónomos circulando por las calles ocupan cada vez más los titulares. La IA está cambiando la forma en que las máquinas interactúan con el mundo, desde mejorar el diagnóstico por imagen médico hasta ayudar en el control de calidad en las líneas de producción.

Gran parte de este progreso proviene de la visión artificial, una rama de la IA que hace posible que las máquinas comprendan e interpreten imágenes. Al igual que los humanos aprenden a reconocer objetos y patrones con el tiempo, los modelos de visión artificial como Ultralytics YOLO11 necesitan ser entrenados con grandes cantidades de datos de imagen para desarrollar su comprensión visual.

Sin embargo, recopilar una cantidad tan vasta de datos visuales no siempre es fácil. Aunque la comunidad de visión artificial ha creado muchos datasets grandes, estos aún pueden omitir ciertas variaciones, como imágenes con objetos con poca luz, elementos parcialmente ocultos o cosas vistas desde diferentes ángulos. Estas diferencias pueden confundir a los modelos de visión artificial que solo han sido entrenados en condiciones específicas.

El aumento de datos de imagen es una técnica que resuelve este problema introduciendo nuevas variaciones en los datos existentes. Al realizar cambios en las imágenes, como ajustar los colores, rotar o cambiar la perspectiva, el dataset se vuelve más diverso, ayudando a los modelos de visión artificial a reconocer objetos mejor en situaciones del mundo real.

En este artículo, exploraremos cómo funciona el aumento de datos de imagen y el impacto que puede tener en las aplicaciones de visión artificial.

Link to this section¿Qué es el aumento de datos de imagen?#

Supongamos que intentas reconocer a un amigo entre una multitud, pero lleva gafas de sol o está de pie en un lugar sombreado. Incluso con estos cambios menores en su apariencia, sigues sabiendo quién es. Por otro lado, un modelo de visión artificial puede tener dificultades con tales variaciones a menos que haya sido entrenado para reconocer objetos en diferentes entornos.

El aumento de datos de imagen mejora el rendimiento del modelo de visión artificial añadiendo versiones modificadas de imágenes existentes a los datos de entrenamiento, en lugar de recopilar miles de imágenes nuevas.

Los cambios en las imágenes como voltear, rotar, ajustar el brillo o añadir pequeñas distorsiones exponen a los modelos de visión artificial a una gama más amplia de condiciones. En lugar de depender de datasets masivos, los modelos pueden aprender de manera eficiente a partir de datasets de entrenamiento más pequeños con imágenes aumentadas.

Ejemplos de imágenes aumentadas de un coche

Fig 1. Ejemplos de imágenes aumentadas de un coche.

Link to this sectionLa importancia del aumento de datos en la visión artificial#

Aquí tienes algunas de las razones clave por las que el aumento es esencial para la visión artificial:

Reduce los requisitos de datos: Recopilar grandes datasets de imágenes requiere tiempo y recursos. El aumento puede utilizarse para entrenar modelos eficazmente sin necesidad de datasets masivos.
Evita el sobreajuste (overfitting): Un modelo entrenado con muy pocos ejemplos puede memorizar detalles en lugar de reconocer patrones generales. Añadir variedad mediante el aumento garantiza que los modelos de visión artificial aprendan de una forma que se aplique a datos nuevos y desconocidos.
Imita imágenes imperfectas: Las imágenes en los datasets suelen ser demasiado perfectas, pero las fotos del mundo real pueden estar borrosas, oscurecidas o distorsionadas. Aumentar las imágenes con ruido, oclusiones u otras variaciones las hace más realistas.
Mejora la robustez del modelo: El entrenamiento con una variedad de imágenes ayuda a la IA a manejar cambios del mundo real, haciéndola más fiable en diferentes entornos, condiciones de iluminación y situaciones.

Link to this section¿Cuándo deberías usar el aumento de datos de imagen?#

El aumento de datos de imagen es especialmente útil cuando un modelo de visión artificial necesita reconocer objetos en diferentes situaciones pero no dispone de suficientes imágenes variadas.

Por ejemplo, si los investigadores están entrenando un modelo de visión artificial para identificar especies submarinas poco comunes que rara vez se fotografían, el dataset puede ser pequeño o carecer de variación. Al aumentar las imágenes (ajustando los colores para simular diferentes profundidades de agua, añadiendo ruido para imitar condiciones turbias o alterando ligeramente las formas para tener en cuenta el movimiento natural), el modelo puede aprender a detectar objetos submarinos con mayor precisión.

Aquí tienes otras situaciones donde el aumento marca una gran diferencia:

Equilibrio del dataset: Algunos objetos pueden aparecer con menos frecuencia en los datos de entrenamiento, lo que provoca que los modelos de visión artificial sean sesgados. El aumento ayuda a crear más ejemplos de objetos raros para que el modelo pueda reconocer todas las categorías de manera justa.
Adaptación a diferentes cámaras: Las imágenes pueden verse diferentes dependiendo del dispositivo. El aumento ayuda a que los modelos de visión artificial funcionen bien en fotos con diferentes resoluciones, iluminación y calidad.
Corrección de errores menores de etiquetado: Los desplazamientos leves, el recorte o las rotaciones ayudan a los modelos de visión artificial a reconocer los objetos correctamente, incluso si las etiquetas originales no están perfectamente alineadas.

Link to this sectionCómo funciona el aumento de datos de imagen#

En los primeros días de la visión artificial, el aumento de datos de imagen implicaba principalmente técnicas básicas de procesamiento de imágenes como voltear, rotar y recortar para aumentar la diversidad del dataset. A medida que la IA mejoraba, se introdujeron métodos más avanzados, como el ajuste de colores (transformaciones de espacio de color), el enfoque o desenfoque de imágenes (filtros de kernel) y la combinación de múltiples imágenes (mezcla de imágenes) para mejorar el aprendizaje.

El aumento puede ocurrir antes y durante el entrenamiento del modelo. Antes del entrenamiento, se pueden añadir imágenes modificadas al dataset para proporcionar más variedad. Durante el entrenamiento, las imágenes pueden alterarse aleatoriamente en tiempo real, ayudando a los modelos de visión artificial a adaptarse a diferentes condiciones.

Estos cambios se realizan mediante transformaciones matemáticas. Por ejemplo, la rotación inclina una imagen, el recorte elimina partes para imitar diferentes vistas y los cambios de brillo simulan variaciones de iluminación. El desenfoque suaviza las imágenes, el enfoque aclara los detalles y la mezcla de imágenes combina partes de diferentes imágenes. Los frameworks de visión artificial y herramientas como OpenCV, TensorFlow y PyTorch pueden automatizar estos procesos, haciendo que el aumento sea rápido y eficaz.

Link to this sectionTécnicas clave de aumento de datos de imagen#

Ahora que hemos discutido qué es el aumento de datos de imagen, analicemos más de cerca algunas técnicas fundamentales de aumento de datos de imagen utilizadas para mejorar los datos de entrenamiento.

Link to this sectionAjuste de orientación y posición#

Los modelos de visión artificial como YOLO11 a menudo necesitan reconocer objetos desde varios ángulos y puntos de vista. Para ayudar con esto, las imágenes pueden voltearse horizontal o verticalmente para que el modelo de IA aprenda a reconocer objetos desde diferentes puntos de vista.

Del mismo modo, rotar las imágenes cambia ligeramente su ángulo, permitiendo al modelo identificar objetos desde múltiples perspectivas. Además, desplazar las imágenes en diferentes direcciones (traslación) ayuda a los modelos a ajustarse a pequeños cambios posicionales. Estas transformaciones aseguran que los modelos generalicen mejor a las condiciones del mundo real donde la colocación de objetos en una imagen es impredecible.

Diferentes métodos de aumento relacionados con la orientación y la posición

Fig 2. Diferentes métodos de aumento relacionados con la orientación y la posición.

Link to this sectionCambio de tamaño y recorte#

Con respecto a las soluciones de visión artificial del mundo real, los objetos en las imágenes pueden aparecer a distancias y tamaños variables. Los modelos de visión artificial tienen que ser lo suficientemente robustos para detectarlos independientemente de estas diferencias.

Para mejorar la adaptabilidad, se pueden utilizar los siguientes métodos de aumento:

Escalado: Cambiar el tamaño altera las dimensiones de la imagen manteniendo sus proporciones, permitiendo que los modelos de IA detecten objetos a diferentes distancias.
Recorte: Elimina partes innecesarias de una imagen, ayudando al modelo a centrarse en áreas clave y reduciendo las distracciones de fondo.
Cizallamiento (Shearing): Inclinar ligeramente una imagen simula una apariencia inclinada o estirada, ayudando a la IA a reconocer objetos desde diferentes ángulos.

Estos ajustes ayudan a los modelos de visión artificial a reconocer objetos incluso si su tamaño o forma cambian ligeramente.

Link to this sectionAjustes de perspectiva y distorsión#

Los objetos en las imágenes pueden verse diferentes dependiendo del ángulo de la cámara, lo que dificulta el reconocimiento para los modelos de visión artificial. Para ayudar a los modelos a manejar estas variaciones, las técnicas de aumento pueden ajustar cómo se presentan los objetos en las imágenes.

Por ejemplo, las transformaciones de perspectiva pueden cambiar el ángulo de visión, haciendo que un objeto parezca visto desde una posición diferente. Esto permite a los modelos de visión artificial reconocer objetos incluso cuando están inclinados o capturados desde un punto de vista inusual.

Otro ejemplo es una transformación elástica que estira, dobla o deforma las imágenes para simular distorsiones naturales, de modo que los objetos aparezcan como lo harían en reflejos o bajo presión.

Link to this sectionModificaciones de color e iluminación#

Las condiciones de iluminación y las diferencias de color pueden afectar significativamente a cómo los modelos de visión artificial interpretan las imágenes. Dado que los objetos pueden aparecer de manera diferente bajo varios ajustes de iluminación, las siguientes técnicas de aumento pueden ayudar a manejar estas situaciones:

Ajustes de brillo y contraste: Simular diferentes condiciones de iluminación ayuda a los modelos de visión artificial a reconocer objetos tanto en entornos brillantes como oscuros.
Jittering de color: Cambiar aleatoriamente el tono, la saturación y el balance de color hace que los modelos de visión artificial sean más adaptables a diferentes cámaras y condiciones de iluminación.
Conversión a escala de grises: Convertir las imágenes a blanco y negro anima a los modelos de visión artificial a centrarse en las formas y texturas en lugar del color.

Ejemplos de aumentos relacionados con variaciones de color

Fig 3. Ejemplos de aumentos relacionados con variaciones de color.

Link to this sectionTécnicas avanzadas de aumento de datos de imagen#

Hasta ahora, solo hemos explorado técnicas de aumento que modifican una única imagen. Sin embargo, algunos métodos avanzados implican combinar varias imágenes para mejorar el aprendizaje de la IA.

Por ejemplo, MixUp combina dos imágenes, ayudando a los modelos de visión artificial a comprender las relaciones entre objetos y mejorando su capacidad para generalizar en diferentes escenarios. CutMix va un paso más allá al reemplazar una sección de una imagen con parte de otra, permitiendo que los modelos aprendan de múltiples contextos dentro de la misma imagen. Mientras tanto, CutOut funciona de forma diferente al eliminar partes aleatorias de una imagen, entrenando a los modelos de visión artificial para reconocer objetos incluso cuando están parcialmente ocultos u obstruidos.

Técnicas avanzadas de aumento de datos de imagen como MixUp, CutMix y CutOut

Fig 4. Técnicas avanzadas de aumento de datos de imagen.

Link to this sectionEl papel de la IA generativa en el aumento de datos de imagen#

La IA generativa está ganando terreno en muchas industrias y aplicaciones cotidianas. Probablemente te la hayas encontrado en relación con imágenes generadas por IA, vídeos deepfake o aplicaciones que crean avatares realistas. Pero más allá de la creatividad y el entretenimiento, la IA generativa desempeña un papel crucial en el entrenamiento de modelos de visión artificial generando nuevas imágenes a partir de las existentes.

En lugar de simplemente voltear o rotar imágenes, puede crear variaciones realistas: cambiando expresiones faciales, estilos de ropa o incluso simulando diferentes condiciones meteorológicas. Estas variaciones ayudan a que los modelos de visión artificial sean más adaptables y precisos en diversos escenarios del mundo real. Los modelos de IA generativa avanzados como las GAN (Redes Generativas Antagónicas) y los modelos de difusión también pueden completar detalles faltantes o crear imágenes sintéticas de alta calidad.

Link to this sectionLimitaciones del aumento de datos de imagen#

Aunque el aumento de datos mejora los datasets de entrenamiento, también hay algunas limitaciones a considerar. Aquí tienes algunos retos clave relacionados con el aumento de datos de imagen:

Diversidad de datos limitada: Las imágenes aumentadas provienen de datos existentes y no pueden introducir patrones completamente nuevos ni perspectivas poco comunes.
Posible distorsión de datos: Las transformaciones excesivas pueden hacer que las imágenes sean poco realistas, reduciendo potencialmente la precisión del modelo en escenarios del mundo real.
Mayor carga de cálculo: El aumento en tiempo real que tiene lugar durante el entrenamiento del modelo puede requerir bastante potencia de procesamiento, ralentizando el entrenamiento y aumentando el uso de memoria.
El desequilibrio de clases persiste: El aumento no crea muestras completamente nuevas, por lo que las categorías subrepresentadas aún pueden conducir a un aprendizaje sesgado.

Link to this sectionUna aplicación del mundo real del aumento de datos de imagen#

Una aplicación interesante del aumento de datos de imagen es en los coches autónomos, donde las decisiones en una fracción de segundo tomadas por modelos de visión artificial como YOLO11 son cruciales. El modelo tiene que ser capaz de detectar carreteras, personas y otros objetos con precisión.

Sin embargo, las condiciones del mundo real que encuentra un vehículo autónomo pueden ser impredecibles. El mal tiempo, el desenfoque por movimiento y las señales ocultas pueden hacer que las soluciones de visión artificial en este sector sean complejas. Entrenar modelos de visión artificial solo con imágenes del mundo real a menudo no es suficiente. Los datasets de imágenes para los modelos en los coches autónomos necesitan ser diversos para que el modelo pueda aprender a manejar situaciones inesperadas.

El aumento de datos de imagen resuelve esto simulando niebla, ajustando el brillo y distorsionando formas. Estos cambios ayudan a los modelos a reconocer objetos en diferentes condiciones. Como resultado, los modelos se vuelven más inteligentes y fiables.

Con el entrenamiento aumentado, las soluciones de visión artificial en coches autónomos se adaptan mejor y toman decisiones más seguras. Unos resultados más precisos significan menos accidentes y una navegación mejorada.

Aumento de datos de imagen aplicado a imágenes de coches autónomos

Fig 5. Un ejemplo de aumento de datos de imagen con respecto a los coches autónomos.

Los coches autónomos son solo un ejemplo. De hecho, el aumento de datos de imagen es crucial en una amplia gama de sectores, desde la imagen médica hasta el análisis minorista. Cualquier aplicación que dependa de la visión artificial puede beneficiarse potencialmente del aumento de datos de imagen.

Link to this sectionConclusiones clave#

Los sistemas de visión artificial deben ser capaces de reconocer objetos en diferentes condiciones, pero recopilar infinitas imágenes del mundo real para el entrenamiento puede ser difícil. El aumento de datos de imagen resuelve esto creando variaciones de imágenes existentes, ayudando a los modelos a aprender más rápido y a funcionar mejor en situaciones del mundo real. Mejora la precisión, asegurando que los modelos de visión artificial como YOLO11 puedan manejar diferentes iluminaciones, ángulos y entornos.

Para empresas y desarrolladores, el aumento de datos de imagen ahorra tiempo y esfuerzo a la vez que hace que los modelos de visión artificial sean más fiables. Desde la sanidad hasta los coches autónomos, muchas industrias dependen de ello. A medida que la visión artificial sigue evolucionando, el aumento continuará siendo una parte esencial de la construcción de modelos más inteligentes y adaptables para el futuro.

Únete a nuestra comunidad y visita nuestro repositorio de GitHub para ver la IA en acción. Explora nuestras opciones de licencias y descubre más sobre la IA en la agricultura y la visión artificial en la fabricación en nuestras páginas de soluciones.

Explore solutions

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

La guía definitiva sobre aumentación de datos en 2025

Link to this section¿Qué es el aumento de datos de imagen?#

Link to this sectionLa importancia del aumento de datos en la visión artificial#

Link to this section¿Cuándo deberías usar el aumento de datos de imagen?#

Link to this sectionCómo funciona el aumento de datos de imagen#

Link to this sectionTécnicas clave de aumento de datos de imagen#

Link to this sectionAjuste de orientación y posición#

Link to this sectionCambio de tamaño y recorte#

Link to this sectionAjustes de perspectiva y distorsión#

Link to this sectionModificaciones de color e iluminación#

Link to this sectionTécnicas avanzadas de aumento de datos de imagen#

Link to this sectionEl papel de la IA generativa en el aumento de datos de imagen#

Link to this sectionLimitaciones del aumento de datos de imagen#

Link to this sectionUna aplicación del mundo real del aumento de datos de imagen#

Link to this sectionConclusiones clave#

Explore solutions

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

¡Construyamos juntos el futuro de la IA!