Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Diffusion Forcing

Esplora Diffusion Forcing, un paradigma di modellazione generativa che combina la predizione autoregressiva con la diffusione di sequenze per la generazione coerente di dati temporali.

Diffusion Forcing è un paradigma di modellazione generativa avanzato, introdotto nel 2024, che unisce i punti di forza della predizione autoregressiva del prossimo token con la diffusione dell'intera sequenza. Applicando livelli di rumore indipendenti e variabili a diversi passaggi all'interno di una sequenza, questa tecnica consente ai modelli di machine learning di generare dati temporali altamente coerenti. A differenza dei metodi tradizionali che prevedono token discreti uno alla volta o denotano un'intera sequenza simultaneamente, Diffusion Forcing addestra i modelli ad agire come robusti pianificatori e generatori di sequenze, gestendo stati continui con dipendenze complesse a lungo termine.

Link to this sectionCome funziona Diffusion Forcing#

Nella sua essenza, Diffusion Forcing trae ispirazione dal classico teacher forcing utilizzato nelle reti neurali ricorrenti. Tuttavia, invece di fornire token discreti di ground-truth per prevedere il passaggio successivo, fornisce cronologie continue parzialmente rumorose a un Transformer causale. Il modello impara a rimuovere il rumore dallo stato attuale condizionandolo al passato. Ciò consente alla rete di regolare dinamicamente il livello di rumore per frame, fornendo un framework flessibile per le attività che richiedono sia precisione localizzata che un'ampia consapevolezza temporale.

Questo approccio è estremamente vantaggioso quando costruisci AI agents intelligenti che devono reagire a ambienti imprevedibili pur aderendo a un piano a lungo termine, evitando i problemi di accumulo di errori spesso riscontrati nei modelli autoregressivi standard.

Link to this sectionApplicazioni nel mondo reale#

Diffusion Forcing sta rapidamente guadagnando terreno in diversi ambiti complessi di artificial intelligence:

  • Robotica e controllo visuo-motorio: i bracci robotici autonomi e i sistemi a guida autonoma utilizzano Diffusion Forcing per generare piani di traiettoria fluidi e continui. Prevedendo sequenze di comandi motori continui, i robot possono adattarsi a ostacoli dinamici mantenendo un percorso stabile verso il loro obiettivo.
  • Generazione e previsione video: nelle pipeline avanzate di computer vision, i modelli sfruttano questa tecnica per prevedere futuri frame video con una rigorosa coerenza temporale, evitando gli artefatti di sfarfallio comunemente visti nei precedenti approcci generativi.

Link to this sectionDiffusion Forcing vs. modelli di diffusione standard#

Sebbene condividano un meccanismo di denoise fondamentale, Diffusion Forcing è distintamente diverso dai Diffusion Models standard. I modelli di diffusione tradizionali, come quelli utilizzati per la generazione text-to-image, solitamente rimuovono il rumore da tutti i pixel o variabili latenti di un singolo output statico simultaneamente. Al contrario, Diffusion Forcing modella esplicitamente una serie temporale, costringendo la rete a rispettare l'ordinamento causale della sequenza. Ciò lo rende molto più adatto per attività temporali come la predizione della traiettoria e l'action recognition.

Link to this sectionIntegrazione dell'elaborazione delle sequenze nella pratica#

Sebbene Diffusion Forcing si applichi principalmente alle attività di sequenza generativa, l'interpretazione delle sequenze temporali è altrettanto critica nelle moderne pipeline di visione. Ad esempio, puoi tracciare in modo efficiente gli oggetti attraverso frame video sequenziali utilizzando Ultralytics YOLO26, che gestisce la coerenza temporale nativamente durante l'object tracking.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for high-speed inference
model = YOLO("yolo26n.pt")

# Process a temporal sequence (video) to maintain consistent object identities
results = model.track(source="path/to/video.mp4", stream=True)

# Iterate through the sequence of frames
for frame_result in results:
    # Access temporal tracking IDs for objects in the current state
    print(f"Tracked {len(frame_result.boxes)} objects in the current frame.")

Per i team che cercano di scalare la raccolta di dati di sequenza e addestrare modelli di visione avanzati, l'Ultralytics Platform fornisce robusti strumenti basati su cloud per gestire dataset complessi, tracciare esperimenti e distribuire modelli nativamente sull'edge. Che tu stia sperimentando con transformers causali all'avanguardia in PyTorch o distribuendo sistemi di tracciamento in tempo reale, padroneggiare l'intersezione tra dati spaziali e temporali è essenziale per il futuro dell'AI.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning