Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

ControlNet

Esplora come ControlNet fornisce un controllo spaziale preciso sull'AI generativa. Impara a usare Ultralytics YOLO26 per estrarre pose per guidare la generazione di immagini oggi.

ControlNet è un'architettura di rete neurale avanzata progettata per garantire un controllo spaziale e granulare sui modelli di intelligenza artificiale generativa da testo a immagine. Introdotta originariamente per potenziare modelli come Stable Diffusion, consente di guidare la generazione di immagini utilizzando condizioni di input aggiuntive oltre ai semplici prompt testuali. Inserendo guide visive specifiche, come mappe dei bordi, mappe di profondità o scheletri umani, nella rete, puoi determinare l'esatta composizione, postura o struttura dell'output generato, colmando il divario tra descrizioni in linguaggio naturale ed esecuzione visiva precisa.

Link to this sectionCome funziona l'architettura#

L'innovazione principale di ControlNet risiede nella sua capacità di preservare la vasta conoscenza pre-addestrata di un modello di base (foundation model) imparando al contempo nuovi compiti di condizionamento. Ottiene questo risultato bloccando i parametri del blocco della rete neurale originale e creando un clone addestrabile. Questo clone è collegato al modello bloccato utilizzando speciali strati di "zero convoluzione", che si inizializzano con pesi pari a zero per garantire che non venga aggiunto rumore durante le prime fasi del fine-tuning. Puoi leggere ulteriori dettagli sulla teoria matematica e strutturale nella pubblicazione originale della ricerca ControlNet su arXiv.

Questa struttura unica consente agli sviluppatori di addestrare solidi controlli di condizionamento su hardware di livello consumer, rendendolo estremamente accessibile rispetto all'addestramento di un enorme modello di deep learning da zero.

Link to this sectionControlNet vs. modelli di diffusione e LoRA#

Quando si discute di intelligenza artificiale generativa, è utile distinguere ControlNet da concetti correlati:

  • Modelli di diffusione: Sono i motori di base sottostanti che generano immagini rimuovendo iterativamente il rumore. Si basano quasi esclusivamente su prompt testuali.
  • LoRA (Low-Rank Adaptation): LoRA è un metodo per insegnare rapidamente a un modello un nuovo stile o soggetto (come un personaggio specifico o uno stile artistico). Al contrario, ControlNet determina l'esatta disposizione spaziale dell'immagine.

Link to this sectionApplicazioni nel mondo reale#

ControlNet ha espanso drasticamente l'utilità della computer vision e dell'IA generativa nei flussi di lavoro professionali.

  • Rendering di concetti architettonici: Architetti e designer d'interni utilizzano ControlNet per trasformare semplici progetti di progettazione assistita dal computer (CAD) in bianco e nero o schizzi fatti a mano in rendering fotorealistici di edifici e stanze.
  • Posa dei personaggi nello sviluppo di giochi: Gli animatori sfruttano i modelli di stima della posa umana per estrarre strutture scheletriche da un video di riferimento. Questi scheletri vengono inseriti in ControlNet per generare sprite di personaggi coerenti e stilizzati che mantengono pose precise per le risorse dei videogiochi, riducendo significativamente il tempo di illustrazione manuale.

Link to this sectionPreparazione delle condizioni per ControlNet#

Per utilizzare ControlNet in modo efficace, devi prima estrarre la condizione spaziale desiderata da un'immagine sorgente. Ad esempio, puoi utilizzare Ultralytics YOLO26, il modello di visione all'avanguardia più recente, per estrarre uno scheletro di posa umana. Questo scheletro viene quindi salvato e utilizzato come input di condizionamento per una pipeline da testo a immagine abilitata per ControlNet.

from ultralytics import YOLO

# Load the Ultralytics YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Perform inference to extract the human pose skeleton
results = model("character_reference.jpg")

# Save the resulting plotted skeleton to use as ControlNet input
results[0].save("pose_conditioning.jpg")

Che tu stia preparando i bordi di Canny utilizzando funzioni standard di OpenCV o estraendo maschere di segmentazione avanzate, preparare input di alta qualità è essenziale. Per la gestione dei dataset basata su cloud e l'annotazione dei dati necessaria per addestrare condizioni ControlNet personalizzate, piattaforme come Ultralytics Platform forniscono un ambiente end-to-end senza interruzioni per i moderni team di IA.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning