Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Guías

Mejora la robustez del modelo de IA con aumento de datos

Descubre cómo añadir variaciones realistas a los datos de entrenamiento mediante el aumento de datos ayuda a mejorar la robustez del modelo de IA y su rendimiento en el mundo real.

ABAbirami Vina
4 min read
Mejorando la robustez del modelo de IA con aumento de datos

Las pruebas son una parte crucial en la creación de cualquier solución tecnológica. Muestran a los equipos cómo funciona realmente un sistema antes de su lanzamiento y les permiten solucionar problemas a tiempo. Esto es aplicable en muchos campos, incluida la IA, donde se espera que los modelos gestionen condiciones impredecibles del mundo real una vez desplegados.

Por ejemplo, la visión artificial es una rama de la IA que enseña a las máquinas a comprender imágenes y vídeos. Modelos de visión artificial como Ultralytics YOLO26 soportan tareas como la detección de objetos, la segmentación de instancias y la clasificación de imágenes.

Pueden utilizarse en muchas industrias para aplicaciones como la monitorización de pacientes, el análisis de tráfico, el pago automatizado y la inspección de calidad en la fabricación. Sin embargo, incluso con modelos avanzados y datos de entrenamiento de alta calidad, las soluciones de IA visual pueden tener dificultades al enfrentarse a variaciones del mundo real como cambios en la iluminación, el movimiento o la obstrucción parcial de objetos.

Esto ocurre porque los modelos aprenden de los ejemplos que reciben durante el entrenamiento. Si no han visto previamente condiciones como deslumbramientos, desenfoque por movimiento o visibilidad parcial, es menos probable que reconozcan los objetos correctamente en esos escenarios.

Una forma de mejorar la robustez del modelo es mediante el aumento de datos. En lugar de recopilar grandes cantidades de datos nuevos, los ingenieros pueden realizar cambios pequeños y significativos en las imágenes existentes, como ajustar la iluminación, recortar o mezclar imágenes. Esto ayuda al modelo a aprender a reconocer los mismos objetos en una gama más amplia de situaciones.

En este artículo, exploraremos cómo el aumento de datos mejora la robustez del modelo y la fiabilidad de los sistemas de IA visual cuando se despliegan fuera de entornos controlados. ¡Empecemos!

Link to this sectionCómo comprobar la robustez de un modelo#

Antes de profundizar en el aumento de datos, hablemos sobre cómo saber si un modelo de visión artificial está realmente listo para su uso en el mundo real.

Un modelo robusto sigue funcionando bien incluso cuando las condiciones cambian, en lugar de trabajar solo con imágenes limpias y perfectamente etiquetadas. Aquí tienes algunos factores prácticos que debes tener en cuenta al evaluar la robustez de un modelo de IA:

  • Cambios en la iluminación: Los modelos pueden comportarse de forma diferente cuando se exponen a luz brillante, baja iluminación, deslumbramientos o sombras, lo que puede afectar a la confianza con la que se detectan los objetos.
  • Oclusión parcial: En las escenas cotidianas, los objetos suelen estar bloqueados por otros elementos o solo son parcialmente visibles. Un modelo más robusto es capaz de reconocerlos incluso con información visual faltante.
  • Escenas concurridas: Los entornos con muchos objetos superpuestos pueden hacer que la detección sea más difícil. Los modelos que funcionan bien en estos casos suelen ser más fiables en entornos complejos.

Obtener buenos resultados en imágenes limpias y perfectamente capturadas no siempre se traduce en un rendimiento sólido en el mundo real. Las pruebas regulares en condiciones variadas ayudan a mostrar qué tan bien se mantiene un modelo una vez desplegado.

Link to this section¿Qué es el aumento de datos?#

La forma en que aparece un objeto en una foto puede cambiar según la iluminación, el ángulo, la distancia o el fondo. Cuando se entrena un modelo de visión artificial, el conjunto de datos del que aprende debe incluir este tipo de variaciones para que pueda funcionar bien en entornos impredecibles.

El aumento de datos amplía un conjunto de datos de entrenamiento creando ejemplos adicionales a partir de las imágenes que ya tienes. Esto se hace aplicando cambios intencionados como rotar o voltear una imagen, ajustar el brillo o recortar parte de ella.

Por ejemplo, imagina que solo tienes una foto de un gato. Si rotas la imagen o cambias su brillo, puedes crear varias versiones nuevas a partir de esa misma imagen. Cada versión parece ligeramente diferente, pero sigue siendo la foto del mismo gato. Estas variaciones ayudan a enseñar al modelo que un objeto puede verse diferente y seguir siendo la misma cosa.

Un vistazo a la mejora de una imagen de un gato

Fig 1. Un vistazo al aumento de una imagen de un gato (Fuente)

Link to this sectionCómo el aumento de datos mejora el rendimiento del modelo#

Durante el entrenamiento del modelo, el aumento de datos puede integrarse directamente en el proceso de entrenamiento. En lugar de crear y almacenar manualmente nuevas copias de imágenes, se pueden aplicar transformaciones aleatorias a medida que se carga cada imagen.

Esto significa que el modelo ve una versión ligeramente diferente de la imagen cada vez, ya sea que parezca más brillante, volteada o parcialmente oculta. Técnicas como el borrado aleatorio pueden incluso eliminar pequeñas regiones de la imagen para simular situaciones del mundo real donde un objeto está bloqueado o solo es parcialmente visible.

Ejemplos de aumento basado en borrado aleatorio

Fig 2. Ejemplos de aumento basado en borrado aleatorio (Fuente)

Ver muchas versiones diferentes de la misma imagen hace posible que el modelo aprenda qué características son importantes, en lugar de depender de un solo ejemplo perfecto. Esta variedad desarrolla la robustez del modelo de IA para que pueda funcionar de manera más fiable en condiciones del mundo real.

Link to this sectionTécnicas comunes de aumento de datos#

Aquí tienes algunas técnicas de aumento de datos utilizadas para introducir variaciones en las imágenes de entrenamiento:

  • Transformaciones geométricas: Estas técnicas cambian cómo aparece un objeto espacialmente dentro de una imagen. Rotar, voltear, cambiar el tamaño, recortar o desplazar una imagen permite al modelo entender cómo se puede ver un objeto desde diferentes ángulos o distancias.
  • Ajustes de color y luz: La iluminación del mundo real rara vez es consistente. Las imágenes pueden ser demasiado brillantes, demasiado oscuras o tener colores ligeramente alterados, dependiendo del entorno o la cámara utilizada. Ajustar el brillo, el contraste, el tono y la saturación permite que los modelos gestionen estos cambios visuales y funcionen bien en diferentes escenas.
  • Variaciones en la calidad de la imagen: El desenfoque o el ruido visual pueden hacer que las imágenes parezcan poco claras. Añadir desenfoque o ruido durante el entrenamiento ayuda al modelo a aprender a lidiar con el desenfoque de movimiento, imágenes con poca luz o resultados de cámaras de menor calidad, para que sea menos sensible a imágenes imperfectas.
  • Aumentos basados en oclusión: En entornos reales, los objetos a menudo están parcialmente bloqueados por otros objetos. Esto se conoce como oclusiones de imagen. Ocultar o enmascarar pequeñas áreas de una imagen durante el entrenamiento ayuda al modelo a aprender a detectar objetos incluso cuando solo una parte de ellos es visible.
  • Aumentos de múltiples imágenes: Estas técnicas combinan partes de múltiples imágenes en un solo ejemplo de entrenamiento, lo que puede aumentar el número de objetos a la vista y mejorar la capacidad del modelo para gestionar escenas complejas o concurridas.

Un ejemplo de aumento con múltiples imágenes

Fig 3. Un ejemplo de aumento de múltiples imágenes (Fuente)

Link to this sectionAumento de datos simplificado con el paquete Python de Ultralytics#

Gestionar conjuntos de datos, crear variaciones de imágenes y escribir código de transformación puede añadir pasos adicionales a la creación de una aplicación de visión artificial. El paquete Python de Ultralytics ayuda a simplificar esto al proporcionar una única interfaz para entrenar, ejecutar y desplegar modelos Ultralytics YOLO como YOLO26. Como parte de este esfuerzo por optimizar los flujos de trabajo de entrenamiento, el paquete incluye un aumento de datos integrado y probado por Ultralytics, optimizado para los modelos YOLO.

También admite integraciones útiles que eliminan la necesidad de herramientas independientes o código personalizado. Específicamente para el aumento de datos, el paquete se integra con Albumentations, una biblioteca de aumento de imágenes ampliamente utilizada. Esta integración permite aplicar aumentos automáticamente durante el entrenamiento, sin necesidad de scripts adicionales o código personalizado.

Link to this sectionGestionar anotaciones y conjuntos de datos aumentados#

Otro factor que afecta a la robustez del modelo es la calidad de la anotación. Etiquetas limpias y precisas, creadas y gestionadas con herramientas de anotación como Roboflow, ayudan al modelo a comprender dónde están los objetos y qué aspecto tienen.

Durante el entrenamiento, los aumentos de datos como volteos, recortes y rotaciones se aplican dinámicamente, y las anotaciones se ajustan automáticamente para coincidir con estos cambios. Cuando las etiquetas son precisas, este proceso funciona sin problemas y proporciona al modelo muchos ejemplos realistas de la misma escena.

Si las anotaciones son inexactas o inconsistentes, esos errores pueden acabar repitiéndose en las imágenes aumentadas, lo que puede hacer que el entrenamiento sea menos efectivo. Empezar con anotaciones precisas evita que estos errores se propaguen y contribuye a una mejor robustez del modelo.

Link to this sectionMejora de aplicaciones de IA visual con aumento de datos#

A continuación, veamos ejemplos de cómo el aumento de datos contribuye a la robustez del modelo de IA en aplicaciones del mundo real.

Link to this sectionAumentar la precisión de la detección de objetos en entornos reales#

Las imágenes sintéticas se utilizan a menudo para entrenar sistemas de detección de objetos cuando los datos reales son limitados, sensibles o difíciles de recopilar. Permiten a los equipos generar rápidamente ejemplos de productos, entornos y ángulos de cámara sin necesidad de capturar cada escenario en la vida real.

Sin embargo, los conjuntos de datos sintéticos a veces pueden parecer demasiado limpios en comparación con las imágenes del mundo real, donde la iluminación cambia, los objetos se superponen y las escenas incluyen desorden de fondo. El aumento de datos ayuda a cerrar esta brecha introduciendo variaciones realistas, como diferentes iluminaciones, ruido o colocación de objetos, para que el modelo aprenda a manejar los tipos de condiciones que verá cuando se despliegue.

Por ejemplo, en un estudio reciente, un modelo YOLO11 fue entrenado completamente con imágenes sintéticas, y se añadió aumento de datos para introducir una variación extra. Esto influyó en que el modelo aprendiera a reconocer objetos de manera más amplia. Funcionó bien cuando se probó en imágenes reales, a pesar de que nunca había visto datos del mundo real durante el entrenamiento.

Link to this sectionHacer que las soluciones de imagen médica sean más fiables#

Los conjuntos de datos de imágenes médicas suelen ser limitados, y las exploraciones en sí mismas pueden variar según el tipo de equipo, la configuración de imagen o el entorno clínico. Las diferencias en la anatomía del paciente, los ángulos, la iluminación o el ruido visual pueden dificultar que los modelos de visión artificial aprendan patrones que se generalicen bien entre pacientes y hospitales.

El aumento de datos ayuda a abordar esto creando múltiples variaciones de la misma exploración durante el entrenamiento, como añadir ruido, desplazar ligeramente la imagen o aplicar pequeñas distorsiones. Estos cambios hacen que los datos de entrenamiento se sientan más representativos de las condiciones clínicas reales.

Por ejemplo, en un estudio de imágenes pediátricas, los investigadores utilizaron YOLO11 para la segmentación anatómica y lo entrenaron con datos médicos aumentados. Introdujeron variaciones como ruido añadido, ligeros cambios de posición y pequeñas distorsiones para hacer que las imágenes fueran más realistas.

Imágenes médicas pediátricas originales y aumentadas

Fig 4. Imágenes médicas pediátricas originales y aumentadas (Fuente)

Al aprender de estas variaciones, el modelo se centró en características anatómicas significativas en lugar de diferencias superficiales. Esto hizo que sus resultados de segmentación fueran más estables en diferentes exploraciones y casos de pacientes.

Link to this sectionConclusiones clave#

Recopilar datos diversos es difícil, pero el aumento de datos permite a los modelos aprender de una gama más amplia de condiciones visuales. Esto resulta en una mayor robustez del modelo al tratar con oclusiones, cambios de iluminación y escenas concurridas. En general, esto les ayuda a funcionar de manera más fiable fuera de los entornos de entrenamiento controlados.

Únete a nuestra comunidad y explora lo último en IA visual en nuestro repositorio de GitHub. Visita nuestras páginas de soluciones para aprender cómo aplicaciones como la IA en la fabricación y la visión artificial en el cuidado de la salud están impulsando el progreso, y consulta nuestras opciones de licencia para potenciar tu próxima solución de IA.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático