Uso de aumentaciones de Albumentations para diversificar tus datos
Aprende a usar Albumentations para realizar aumentaciones al entrenar Ultralytics YOLO11 de forma personalizada, mejorando el rendimiento del modelo con diversos datos de entrenamiento.

Al crear una solución de visión artificial, recopilar un conjunto diverso de imágenes para entrenar modelos de IA de visión puede ser una parte crucial del proceso. A menudo requiere mucho tiempo y dinero, y a veces, las imágenes recopiladas todavía no son lo suficientemente variadas para que los modelos aprendan de forma eficaz.
Por ejemplo, los modelos de visión artificial como Ultralytics YOLO11 pueden entrenarse de forma personalizada con conjuntos de datos de imágenes para diversas tareas de visión artificial relacionadas con diferentes aplicaciones. Los datos diversos son clave porque ayudan al modelo a generalizar mejor, permitiéndole reconocer objetos y patrones en una amplia gama de escenarios del mundo real.
Si tienes dificultades por la falta de datos diversos, las técnicas de aumentación de datos de imagen pueden ser una gran solución. Métodos como rotar, voltear y ajustar el brillo pueden ayudarte a aumentar la variedad de tu conjunto de datos, mejorando la capacidad del modelo para manejar una gama más amplia de condiciones.
Por eso Ultralytics admite una integración para la aumentación de datos de imagen. Usando Albumentations, una herramienta popular que ofrece una colección de transformaciones, puedes crear datos visuales diversos. Esta integración simplifica el proceso de entrenamiento de YOLO11 al aumentar automáticamente las imágenes de entrenamiento, lo que conduce a un mejor rendimiento del modelo.
En este artículo, exploraremos cómo puedes usar la integración de Albumentations, sus beneficios y su impacto en el entrenamiento del modelo.
Link to this section¿Qué es Albumentations?#
Los modelos de visión artificial pueden aprender de un amplio conjunto de imágenes de alta calidad para reconocer objetos en diferentes entornos. Recopilar grandes conjuntos de datos de fuentes del mundo real puede ser lento, costoso e ineficiente. Para simplificar esta tarea, puedes usar la aumentación de datos de imagen para crear nuevas variaciones de imágenes existentes, ayudando a los modelos a aprender de diferentes escenarios sin recopilar más datos.
Específicamente, puedes aprovechar Albumentations, una biblioteca de código abierto presentada para la aumentación eficiente de datos de imagen en 2018. Admite una variedad de operaciones, desde cambios geométricos simples como rotaciones y volteos hasta ajustes más complejos como brillo, contraste y adición de ruido.

Fig 1. Ejemplos de diferentes tipos de aumentaciones de datos de imagen.
Link to this sectionCaracterísticas clave de Albumentations#
Albumentations es conocida por su alto rendimiento, lo que significa que puede procesar imágenes de forma rápida y eficiente. Construida sobre bibliotecas optimizadas como OpenCV y NumPy, maneja grandes conjuntos de datos con un tiempo de procesamiento mínimo, lo que la hace ideal para una aumentación de datos rápida durante el entrenamiento del modelo.
Aquí tienes algunas otras características clave de Albumentations:
- Amplia gama de transformaciones: Albumentations proporciona más de 70 tipos de aumentaciones. Estas variaciones ayudan a los modelos a aprender a detectar objetos a pesar de los cambios en la iluminación, los ángulos o los fondos.
- Optimizada para la velocidad: Utiliza técnicas de optimización avanzadas como SIMD (Single Instruction, Multiple Data), que procesa múltiples puntos de datos a la vez para acelerar la aumentación de imágenes y manejar grandes conjuntos de datos de manera eficiente.
- Tres niveles de aumentaciones: Mejora los datos de tres maneras. Por ejemplo, las aumentaciones a nivel de píxel ajustan el brillo y el color sin alterar los objetos. Mientras tanto, las aumentaciones a nivel espacial modifican el posicionamiento de los objetos preservando detalles clave, y las aumentaciones a nivel de mezcla combinan partes de diferentes imágenes para crear nuevas muestras.
Link to this section¿Por qué deberías usar la integración de Albumentations?#
Quizás te preguntes: hay muchas formas de aplicar aumentaciones a un conjunto de datos, e incluso podrías crear las tuyas usando herramientas como OpenCV. Entonces, ¿por qué elegir una integración que admita una biblioteca como Albumentations?
Crear aumentaciones manualmente con herramientas como OpenCV puede llevar mucho tiempo y requiere cierta experiencia. También puede ser complicado ajustar las transformaciones para obtener los mejores resultados. La integración de Albumentations facilita este proceso. Ofrece muchas transformaciones listas para usar que pueden ahorrarte tiempo y esfuerzo al preparar tu conjunto de datos.
Otra razón para elegir la integración de Albumentations es que funciona sin problemas con la tubería de entrenamiento de modelos de Ultralytics. Hace que sea mucho más fácil entrenar de forma personalizada YOLO11, ya que las aumentaciones se aplican automáticamente durante el entrenamiento. Simplifica el proceso para que puedas centrarte más en mejorar tu modelo en lugar de gestionar la preparación de datos.
Link to this sectionPrimeros pasos con la integración de Albumentations#
Curiosamente, usar las integraciones de Albumentations para entrenar YOLO11 es más sencillo de lo que parece. Una vez configuradas las bibliotecas adecuadas, la integración aplica automáticamente aumentaciones de datos de imagen durante el entrenamiento. Ayuda al modelo a aprender de diferentes variaciones de imagen usando el mismo conjunto de datos.
A continuación, veamos cómo instalar y usar la integración de Albumentations al entrenar de forma personalizada YOLO11.
Link to this sectionInstalación del paquete Python de Ultralytics y Albumentations#
Antes de aplicar aumentaciones, es necesario instalar tanto el paquete Python de Ultralytics como Albumentations. La integración se ha creado para que ambas bibliotecas funcionen juntas de forma fluida por defecto, así que no necesitas preocuparte por configuraciones complejas.
Todo el proceso de instalación se puede completar en solo un par de minutos con un único comando pip, que es una herramienta de gestión de paquetes para instalar bibliotecas de Python, como se muestra en la imagen a continuación.

Fig 2. Instalación de Ultralytics y Albumentations.
Una vez instalado Albumentations, el modo de entrenamiento de modelos de Ultralytics aplica automáticamente aumentaciones de imagen durante el entrenamiento. Si Albumentations no está instalado, estas aumentaciones no se aplicarán. Para obtener más detalles, puedes consultar la documentación oficial de Ultralytics.
Link to this sectionEntrenamiento de YOLO11 con la ayuda de la integración de Albumentations#
Comprendamos mejor lo que sucede internamente con la integración de Albumentations.
Aquí tienes un vistazo más de cerca a las aumentaciones aplicadas durante el entrenamiento de YOLO11:
- Desenfoque (Blur): Esta transformación añade un ligero desenfoque a una imagen. Ayuda al modelo a detectar objetos incluso cuando están fuera de foco.
- Desenfoque de mediana (Median blur): Reduce el ruido aleatorio mientras preserva los bordes de los objetos en una imagen. Esto facilita que el modelo detecte objetos en entornos complejos.
- Escala de grises: Al convertir una imagen a blanco y negro, esta aumentación puede ayudar al modelo a centrarse en las formas y texturas en lugar de en los colores.
- CLAHE (Ecualización de histograma adaptativa limitada por contraste): Esta aumentación aumenta el contraste en las imágenes, particularmente en áreas que son demasiado oscuras o difíciles de ver, como en condiciones de poca luz o bruma. Esto hace que los objetos en esas áreas sean más claros y fáciles de identificar para el modelo.

Fig 3. Un ejemplo de una aumentación de escala de grises aplicada a una imagen de un gato.
Link to this sectionAplicaciones de YOLO11 y la integración de Albumentations#
Si estás entrenando de forma personalizada YOLO11 para una aplicación específica, la integración de Albumentations puede ayudar a mejorar el rendimiento del modelo adaptándose a diversas condiciones. Hablemos de algunas aplicaciones del mundo real y los desafíos que esta integración puede resolver.
Link to this sectionMejora de las imágenes médicas#
La IA de visión en la atención médica está ayudando a los médicos a analizar imágenes médicas con mayor precisión para ayudar con los diagnósticos y mejorar la atención al paciente. De hecho, alrededor de una quinta parte de las organizaciones sanitarias ya están utilizando soluciones de IA.
Sin embargo, la creación de estas soluciones de visión artificial conlleva su propio conjunto de desafíos. Los escáneres médicos pueden variar mucho entre hospitales, influenciados por factores como diferentes equipos, configuraciones e incluso la experiencia de los técnicos. Las variaciones en el brillo, el contraste y la exposición pueden afectar la consistencia y precisión de los modelos de IA de visión, lo que dificulta que funcionen de manera confiable en diferentes entornos.
Aquí es donde la integración de herramientas como Albumentations se vuelve esencial. Al generar múltiples versiones aumentadas del mismo escáner, Albumentations permite que el modelo aprenda de una variedad de calidades de imagen. Esto ayuda a que el modelo sea más robusto, permitiéndole detectar enfermedades con precisión tanto en imágenes de alta como de baja calidad.

Fig 4. Imágenes de rayos X aumentadas.
Link to this sectionMejora de la seguridad y la vigilancia#
Otra aplicación interesante de la IA de visión es la seguridad y la vigilancia. La detección de objetos en tiempo real puede ayudar a los equipos de seguridad a identificar posibles amenazas rápidamente.
Una preocupación principal relacionada con esta aplicación es que las cámaras de seguridad capturan imágenes bajo diversas condiciones de iluminación a lo largo del día, y estas condiciones pueden afectar drásticamente cómo un modelo entiende dichas imágenes. Factores como entornos con poca luz, deslumbramiento o poca visibilidad pueden hacer que sea difícil para los modelos de visión artificial detectar objetos o reconocer posibles amenazas de forma consistente.
La integración de Albumentations ayuda aplicando transformaciones para imitar diferentes condiciones de iluminación. Esto permite que el modelo aprenda a detectar objetos tanto en entornos brillantes como en entornos con poca luz, haciéndolo más confiable y mejorando los tiempos de respuesta en condiciones desafiantes.
Link to this sectionRedefinición de los flujos de trabajo minoristas y la experiencia del cliente#
Un derrame en un pasillo de supermercado, un perro corriendo por una tienda o un niño derribando una exhibición de productos son solo algunos ejemplos de eventos cotidianos que pueden ser casos límite para la IA de visión en el comercio minorista entornos. La visión artificial se utiliza cada vez más para mejorar la experiencia del cliente mediante el seguimiento del comportamiento del comprador, la supervisión del tráfico peatonal y la identificación de productos en los estantes. Sin embargo, estas situaciones del mundo real pueden ser difíciles de entender y procesar con precisión para los sistemas de IA.
Aunque no todas las situaciones pueden representarse en un conjunto de datos de visión artificial, la integración de Albumentations ayuda aumentando los datos para cubrir muchas situaciones posibles, como iluminación inesperada, ángulos inusuales u obstrucciones. Esto ayuda a los modelos de visión artificial a adaptarse a diversas condiciones, mejorando su capacidad para manejar casos límite y realizar predicciones precisas en entornos minoristas dinámicos.
Link to this sectionConclusiones clave#
Recopilar datos diversos del mundo real para el entrenamiento de modelos puede ser complicado, pero Albumentations lo facilita al crear variaciones de imagen que ayudan a los modelos a adaptarse a diferentes condiciones.
La integración de Albumentations respaldada por Ultralytics simplifica el proceso de aplicación de estas aumentaciones mientras entrenas de forma personalizada YOLO11. Esto da como resultado una mejor calidad del conjunto de datos, lo que beneficia a una amplia gama de industrias al producir modelos de IA de visión más precisos y confiables.
Únete a nuestra comunidad y explora nuestro repositorio de GitHub para aprender más sobre IA, y consulta nuestras opciones de licencia para poner en marcha tus proyectos de IA de visión. ¿Te interesan innovaciones como la IA en la fabricación o la visión artificial en la conducción autónoma? Visita nuestras páginas de soluciones para descubrir más.






