Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Diffusion Forcing

Explore o Diffusion Forcing, um paradigma de modelagem generativa que combina previsão autorregressiva com difusão de sequência para geração consistente de dados temporais.

Diffusion Forcing é um paradigma avançado de modelagem generativa introduzido em 2024 que combina os pontos fortes da previsão autorregressiva do próximo token com a difusão de sequência completa. Ao aplicar níveis de ruído independentes e variáveis a diferentes etapas dentro de uma sequência, esta técnica permite que modelos de machine learning gerem dados temporais altamente consistentes. Ao contrário dos métodos tradicionais que preveem tokens discretos um a um ou removem o ruído de uma sequência inteira simultaneamente, o Diffusion Forcing treina modelos para atuarem como planejadores e geradores de sequência robustos, lidando com estados contínuos com dependências complexas de longo horizonte.

Link to this sectionComo o Diffusion Forcing funciona#

Em sua essência, o Diffusion Forcing inspira-se no clássico teacher forcing usado em redes neurais recorrentes. No entanto, em vez de fornecer tokens discretos com base na realidade (ground-truth) para prever o próximo passo, ele fornece históricos contínuos parcialmente ruidosos a um Transformer causal. O modelo aprende a remover o ruído do estado atual condicionado ao passado. Isso permite que a rede ajuste dinamicamente o nível de ruído por quadro, fornecendo uma estrutura flexível para tarefas que exigem precisão localizada e consciência temporal ampla.

Essa abordagem é altamente benéfica ao criar AI agents inteligentes que precisam reagir a ambientes imprevisíveis enquanto aderem a um plano de longo prazo, contornando os problemas de erros compostos frequentemente encontrados em modelos autorregressivos padrão.

Link to this sectionAplicações no Mundo Real#

O Diffusion Forcing está ganhando força rapidamente em vários domínios complexos de artificial intelligence:

  • Robotics and Visuo-Motor Control: Braços robóticos autônomos e sistemas de direção autônoma usam o Diffusion Forcing para gerar planos de trajetória suaves e contínuos. Ao prever sequências de comandos motores contínuos, os robôs podem se adaptar a obstáculos dinâmicos enquanto mantêm um caminho estável em direção ao seu objetivo.
  • Video Generation and Forecasting: Em pipelines avançados de computer vision, os modelos aproveitam esta técnica para prever futuros quadros de vídeo com rigorosa consistência temporal, evitando os artefatos de cintilação comumente vistos em abordagens generativas anteriores.

Link to this sectionDiffusion Forcing vs. Modelos de Difusão Padrão#

Embora compartilhem um mecanismo fundamental de remoção de ruído, o Diffusion Forcing é distintamente diferente dos Diffusion Models padrão. Os modelos de difusão tradicionais, como os usados para a geração de text-to-image, geralmente removem o ruído de todos os pixels ou variáveis latentes de uma única saída estática simultaneamente. Em contraste, o Diffusion Forcing modela explicitamente uma série temporal, forçando a rede a respeitar a ordem de sequência causal. Isso o torna muito mais adequado para tarefas temporais como previsão de trajetória e action recognition.

Link to this sectionIntegrando o Processamento de Sequência na Prática#

Embora o Diffusion Forcing se aplique principalmente a tarefas de sequência generativa, interpretar sequências temporais é igualmente crítico em pipelines de visão modernos. Por exemplo, você pode rastrear objetos eficientemente através de quadros de vídeo sequenciais usando o Ultralytics YOLO26, que lida com a consistência temporal nativamente durante o object tracking.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for high-speed inference
model = YOLO("yolo26n.pt")

# Process a temporal sequence (video) to maintain consistent object identities
results = model.track(source="path/to/video.mp4", stream=True)

# Iterate through the sequence of frames
for frame_result in results:
    # Access temporal tracking IDs for objects in the current state
    print(f"Tracked {len(frame_result.boxes)} objects in the current frame.")

Para equipes que buscam escalar a coleta de dados de sequência e treinar modelos de visão avançados, a Ultralytics Platform fornece ferramentas robustas baseadas em nuvem para gerenciar conjuntos de dados complexos, rastrear experimentos e implantar modelos nativamente na borda. Esteja você experimentando com transformers causais de última geração no PyTorch ou implantando sistemas de rastreamento em tempo real, dominar a interseção de dados espaciais e temporais é essencial para o futuro da AI.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática