Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

ControlNet

Explora cómo ControlNet proporciona un control espacial preciso sobre la IA generativa. Aprende a usar Ultralytics YOLO26 para extraer poses para guiar la generación de imágenes hoy mismo.

ControlNet es una arquitectura de red neuronal avanzada diseñada para otorgar un control espacial preciso sobre modelos generative AI de texto a imagen a gran escala. Introducida originalmente para mejorar modelos como Stable Diffusion, permite a los usuarios guiar la generación de imágenes mediante condiciones de entrada adicionales más allá de las simples instrucciones de texto. Al introducir guías visuales específicas —como mapas de bordes, mapas de profundidad o esqueletos humanos— en la red, los profesionales pueden determinar la composición, la postura o la estructura exacta de la salida generada, salvando la brecha entre las descripciones en lenguaje natural y la ejecución visual precisa.

Link to this sectionCómo funciona la arquitectura#

La innovación principal de ControlNet radica en su capacidad para preservar el vasto conocimiento preentrenado de un foundation model base mientras aprende nuevas tareas de condicionamiento. Logra esto bloqueando los parámetros del bloque de la neural network original y creando un clon entrenable. Este clon se conecta al modelo bloqueado utilizando capas especiales de "convolución cero", que se inicializan con pesos cero para asegurar que no se añada ruido durante las primeras etapas del fine-tuning. Puedes leer más sobre la teoría matemática y estructural en la publicación de investigación original de ControlNet en arXiv.

Esta estructura única permite a los desarrolladores entrenar controles de condicionamiento robustos en hardware de grado consumidor, lo que lo hace muy accesible en comparación con el entrenamiento de un modelo masivo de deep learning desde cero.

Link to this sectionControlNet frente a los modelos de difusión y LoRA#

Al hablar de artificial intelligence generativa, es útil diferenciar ControlNet de conceptos relacionados:

  • Diffusion Models: Son los motores base subyacentes que generan imágenes eliminando ruido de forma iterativa. Dependen casi exclusivamente de instrucciones de texto.
  • LoRA (Low-Rank Adaptation): LoRA es un método para enseñar rápidamente a un modelo un nuevo estilo o sujeto (como un personaje específico o estilo artístico). Por el contrario, ControlNet dicta la disposición espacial exacta de la imagen.

Link to this sectionAplicaciones en el mundo real#

ControlNet ha ampliado drásticamente la utilidad de la computer vision y la IA generativa en los flujos de trabajo profesionales.

  • Representación de conceptos arquitectónicos: Los arquitectos y diseñadores de interiores utilizan ControlNet para transformar computer-aided design (CAD) blueprints básicos en blanco y negro o bocetos dibujados a mano en renders fotorrealistas de edificios y habitaciones.
  • Posado de personajes en el desarrollo de juegos: Los animadores aprovechan modelos de pose estimation humana para extraer estructuras esqueléticas de un vídeo de referencia. Estos esqueletos se introducen en ControlNet para generar sprites de personajes estilizados y coherentes que mantienen posturas exactas para activos de videojuegos, lo que reduce significativamente el tiempo de ilustración manual.

Link to this sectionPreparación de condiciones para ControlNet#

Para utilizar ControlNet con eficacia, primero debes extraer la condición espacial deseada de una imagen fuente. Por ejemplo, puedes usar Ultralytics YOLO26, el modelo de visión más reciente y avanzado, para extraer un esqueleto de pose humana. Este esqueleto se guarda y se utiliza como entrada de condicionamiento para un pipeline de texto a imagen habilitado para ControlNet.

from ultralytics import YOLO

# Load the Ultralytics YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Perform inference to extract the human pose skeleton
results = model("character_reference.jpg")

# Save the resulting plotted skeleton to use as ControlNet input
results[0].save("pose_conditioning.jpg")

Tanto si preparas bordes Canny utilizando OpenCV functions estándar como si extraes máscaras de segmentación avanzadas, preparar entradas de alta calidad es esencial. Para la gestión de conjuntos de datos en la nube y la data annotation necesaria para entrenar condiciones personalizadas de ControlNet, plataformas como Ultralytics Platform proporcionan un entorno integral y fluido para los equipos de IA modernos.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático