Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Diffusion Models

Explora cómo los modelos de difusión utilizan la IA generativa para crear datos de alta fidelidad. Aprende a mejorar el entrenamiento de Ultralytics YOLO26 con datos sintéticos realistas hoy mismo.

Los modelos de difusión son una clase de algoritmos de IA generativa que aprenden a crear nuevas muestras de datos invirtiendo un proceso gradual de adición de ruido. A diferencia de los modelos discriminativos tradicionales utilizados para tareas como la detección de objetos o la clasificación, que predicen etiquetas a partir de los datos, los modelos de difusión se centran en generar contenido de alta fidelidad (especialmente imágenes, audio y vídeo) que imita fielmente las propiedades estadísticas de los datos del mundo real. Se han convertido rápidamente en la solución de vanguardia para la síntesis de imágenes de alta resolución, superando a líderes anteriores como las Redes Generativas Antagónicas (GANs) debido a su estabilidad de entrenamiento y su capacidad para generar resultados diversos.

Link to this sectionCómo funcionan los modelos de difusión#

El mecanismo central de un modelo de difusión se basa en la termodinámica de no equilibrio. El proceso de entrenamiento consta de dos fases distintas: el proceso directo (difusión) y el proceso inverso (eliminación de ruido).

  • Proceso directo: Esta fase destruye sistemáticamente la estructura de una imagen de entrenamiento añadiendo pequeñas cantidades de ruido gaussiano a lo largo de una serie de pasos temporales. A medida que el proceso continúa, los datos complejos (como la foto de un gato) se transforman gradualmente en puro ruido aleatorio no estructurado.
  • Proceso inverso: El objetivo de la red neuronal es aprender a revertir esta corrupción. Partiendo del ruido aleatorio, el modelo predice el ruido que se añadió en cada paso y lo resta. Al eliminar el ruido de forma iterativa, el modelo "limpia" la señal aleatoria hasta que emerge una imagen coherente y de alta calidad.

Este refinamiento iterativo permite un control excepcional sobre los detalles finos y la textura, una ventaja significativa sobre los métodos de generación de un solo paso.

Link to this sectionAplicaciones en el mundo real#

Los modelos de difusión han pasado de la investigación académica a ser herramientas prácticas de nivel de producción en diversos sectores.

  • Generación de datos sintéticos: Una de las aplicaciones más valiosas para los ingenieros de visión artificial es la creación de datos sintéticos para aumentar los conjuntos de datos de entrenamiento. Si a un conjunto de datos le falta diversidad (por ejemplo, faltan imágenes de coches en condiciones de nieve), un modelo de difusión puede generar variaciones realistas. Esto ayuda a mejorar la robustez de modelos de visión como YOLO26 cuando se despliegan en entornos impredecibles.
  • Inpainting y edición de imágenes: Los modelos de difusión potencian herramientas de edición avanzadas que permiten a los usuarios modificar regiones específicas de una imagen. Esta técnica, conocida como inpainting, puede eliminar objetos no deseados o rellenar partes faltantes de una foto basándose en el contexto circundante. Los arquitectos y diseñadores utilizan esto para la creación rápida de prototipos, visualizando cambios en productos o entornos sin necesidad de renderizado 3D manual.

Link to this sectionDiferenciación de términos clave#

Es útil distinguir los modelos de difusión de otras arquitecturas generativas:

  • Modelos de difusión frente a GANs: Aunque las GANs utilizan dos redes en competencia (un generador y un discriminador) y son conocidas por su rápido muestreo, a menudo sufren de "colapso de modo", donde el modelo produce variedades limitadas de resultados. Los modelos de difusión suelen ser más estables durante el entrenamiento y cubren la distribución de los datos de forma más completa, aunque pueden ser más lentos en el tiempo de inferencia.
  • Modelos de difusión frente a VAEs: Los Autoencoders Variacionales (VAEs) comprimen los datos en un espacio latente y luego los reconstruyen. Aunque los VAEs son rápidos, sus imágenes generadas a veces pueden aparecer borrosas en comparación con los detalles nítidos producidos por los procesos de difusión.

Link to this sectionImplementación práctica#

Aunque entrenar un modelo de difusión desde cero requiere una capacidad de cómputo significativa, los ingenieros pueden aprovechar modelos preentrenados o integrarlos en flujos de trabajo junto a detectores eficientes. Por ejemplo, puedes utilizar un modelo de difusión para generar variaciones de fondo para un conjunto de datos y luego utilizar la Plataforma Ultralytics para anotar y entrenar un modelo de detección sobre esos datos mejorados.

A continuación se muestra un ejemplo conceptual utilizando torch para simular un paso simple de difusión directa (añadir ruido), que es la base del entrenamiento de estos sistemas.

import torch


def add_noise(image_tensor, noise_level=0.1):
    """Simulates a single step of the forward diffusion process by adding Gaussian noise."""
    # Generate Gaussian noise with the same shape as the input image
    noise = torch.randn_like(image_tensor) * noise_level

    # Add noise to the original image
    noisy_image = image_tensor + noise

    # Clamp values to ensure they remain valid image data (e.g., 0.0 to 1.0)
    return torch.clamp(noisy_image, 0.0, 1.0)


# Create a dummy image tensor (3 channels, 64x64 pixels)
dummy_image = torch.rand(1, 3, 64, 64)
noisy_result = add_noise(dummy_image)

print(f"Original shape: {dummy_image.shape}, Noisy shape: {noisy_result.shape}")

Link to this sectionDirecciones futuras#

El campo está evolucionando rápidamente hacia modelos de difusión latente (LDMs), que operan en un espacio latente comprimido en lugar de en el espacio de píxeles para reducir los costes computacionales. Esta eficiencia hace viable ejecutar potentes modelos generativos en hardware de consumo. A medida que continúa la investigación, esperamos una integración más estrecha entre las entradas generativas y las tareas discriminativas, como el uso de escenarios generados por difusión para validar la seguridad de vehículos autónomos o mejorar el análisis de imágenes médicas simulando patologías raras.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático