Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Generative Adversarial Network (GAN)

Explora cómo las redes generativas adversarias (GAN) crean datos sintéticos realistas. Aprende a entrenar Ultralytics YOLO26 con conjuntos de datos mejorados por GAN para la IA de visión.

Las redes generativas antagónicas (GAN) son un marco sofisticado dentro del campo de la inteligencia artificial (IA) diseñado para generar nuevas instancias de datos que se asemejen a tus datos de entrenamiento. Introducidas en un artículo innovador por Ian Goodfellow y sus colegas en 2014, las GAN operan bajo un principio único de competencia entre dos redes neuronales distintas. Esta arquitectura se ha convertido en un pilar de la IA generativa moderna, permitiendo la creación de imágenes fotorrealistas, la mejora de vídeo y la síntesis de diversos conjuntos de datos de entrenamiento para tareas complejas de aprendizaje automático.

Link to this sectionLa arquitectura antagónica#

El mecanismo central de una GAN implica dos modelos entrenados simultáneamente en un juego de suma cero, descrito a menudo mediante la analogía de un falsificador y un detective.

  • El generador: Esta red actúa como el "falsificador". Toma ruido aleatorio (un vector latente) como entrada e intenta producir datos, como una imagen, que parezcan auténticos. Su objetivo principal es engañar al discriminador para que crea que la salida generada es real. Este proceso es fundamental para crear datos sintéticos de alta calidad.
  • El discriminador: Actuando como el "detective", esta red evalúa las entradas para distinguir entre muestras reales de los datos de entrenamiento y muestras falsas producidas por el generador. Funciona como un clasificador binario estándar, generando una probabilidad de que la entrada sea real.

Durante el proceso de entrenamiento, el generador minimiza la probabilidad de que el discriminador realice una clasificación correcta, mientras que el discriminador maximiza esa misma probabilidad. Este bucle antagónico continúa hasta que el sistema alcanza un equilibrio de Nash, un estado en el que el generador produce datos tan realistas que el discriminador ya no puede distinguirlos de ejemplos del mundo real.

Link to this sectionAplicaciones reales en IA de visión#

Las GAN han trascendido la teoría académica para resolver problemas prácticos en diversas industrias, particularmente en visión por ordenador.

  1. Aumentación de datos para el entrenamiento de modelos: En escenarios donde los datos son escasos o confidenciales, como el análisis de imágenes médicas, las GAN se utilizan para generar ejemplos sintéticos realistas. Por ejemplo, crear escaneos de resonancia magnética sintéticos permite a los investigadores entrenar modelos de diagnóstico robustos sin comprometer la privacidad del paciente. Esta técnica también es vital para los vehículos autónomos, donde las GAN pueden simular condiciones climáticas o escenarios de tráfico raros para mejorar la seguridad.

  2. Superresolución y mejora de imagen: Las GAN son altamente efectivas en superresolución, el proceso de escalar imágenes de baja resolución a alta definición mientras se inventan detalles plausibles. Esto se utiliza ampliamente en la restauración de archivos históricos, la mejora de imágenes satelitales para mapeo global y la mejora de la calidad de la transmisión de vídeo.

  3. Transferencia de estilo: Esta aplicación permite aplicar el estilo estético de una imagen al contenido de otra. Herramientas como CycleGAN permiten transformaciones como convertir fotos diurnas en escenas nocturnas o convertir bocetos en prototipos de productos fotorrealistas, agilizando los flujos de trabajo en IA en el comercio minorista de moda.

Link to this sectionDiferencia entre GAN y modelos de difusión#

Aunque ambas son tecnologías generativas, es importante distinguir las GAN de los modelos de difusión como los utilizados en Stable Diffusion.

  • Velocidad de inferencia: Las GAN normalmente generan datos en una sola pasada hacia adelante, lo que las hace significativamente más rápidas en inferencia en tiempo real.
  • Estabilidad del entrenamiento: Los modelos de difusión operan eliminando iterativamente el ruido de una imagen, lo que generalmente resulta en un entrenamiento más estable y una mayor cobertura de modo (diversidad). Por el contrario, las GAN pueden sufrir un "colapso de modo", donde el generador produce una variedad limitada de resultados, aunque técnicas como las Wasserstein GAN (WGAN) ayudan a mitigar esto.

Link to this sectionIntegración de datos generados por GAN con YOLO#

Un caso de uso potente para las GAN es generar conjuntos de datos sintéticos para entrenar modelos de detección de objetos como YOLO26. Si te faltan suficientes imágenes del mundo real de un defecto u objeto específico, una GAN puede generar miles de variaciones etiquetadas. Luego puedes gestionar estos conjuntos de datos y entrenar tu modelo utilizando la Plataforma Ultralytics.

El siguiente ejemplo demuestra cómo cargar un modelo YOLO26 para entrenar con un conjunto de datos, el cual podría incluir sin problemas imágenes sintéticas generadas por GAN para aumentar el rendimiento:

from ultralytics import YOLO

# Load the YOLO26 model (Latest stable Ultralytics model)
model = YOLO("yolo26n.pt")

# Train the model on a dataset configuration file
# The dataset path defined in 'coco8.yaml' can contain both real and GAN-generated images
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

# Verify the model performance on validation data
metrics = model.val()

Link to this sectionDesafíos y consideraciones#

A pesar de sus capacidades, entrenar GAN requiere un cuidadoso ajuste de hiperparámetros. Pueden ocurrir problemas como el de gradiente desvaneciente si el discriminador aprende demasiado rápido, sin proporcionar comentarios significativos al generador. Además, a medida que las GAN se vuelven más capaces de crear deepfakes, la industria se centra cada vez más en la ética de la IA y en el desarrollo de métodos para detectar contenido generado por IA.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático