遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Diffusion Forcing

探索 Diffusion Forcing,这是一种结合自回归预测与序列扩散的生成建模范式,用于生成一致的时间序列数据。

Diffusion Forcing 是一种在 2024 年引入的先进生成建模范式,它融合了自回归下一标记预测和全序列扩散的优势。通过对序列内的不同步骤应用独立且可变的噪声水平,该技术使 机器学习 模型能够生成高度一致的时间序列数据。与传统方法(即逐个预测离散标记或同时去噪整个序列)不同,Diffusion Forcing 训练模型充当稳健的规划器和序列生成器,处理具有复杂长程依赖关系的连续状态。

Link to this sectionDiffusion Forcing 的工作原理#

其核心在于,Diffusion Forcing 从循环神经网络中使用的经典 教师强制 中汲取灵感。然而,它不是输入真实离散标记来预测下一步,而是将部分加噪的连续历史数据输入到因果 Transformer 中。模型学习在以过去为条件的条件下对当前状态进行去噪。这允许网络动态调整每帧的噪声水平,为需要局部精度和广泛时间感知力的任务提供了一个灵活的框架。

在构建必须应对不可预测环境同时又需遵循长期计划的智能 AI 代理 时,这种方法非常有益,它绕过了标准自回归模型中常见的复合误差问题。

Link to this section实际应用#

Diffusion Forcing 正迅速在多个复杂的 人工智能 领域中获得应用:

  • 机器人与视觉运动控制:自主机械臂和自动驾驶系统使用 Diffusion Forcing 来生成平滑、连续的轨迹规划。通过预测连续的电机指令序列,机器人可以在适应动态障碍物的同时保持通往目标的稳定路径。
  • 视频生成与预测:在先进的 计算机视觉 流水线中,模型利用该技术以严格的时间一致性预测未来的视频帧,从而避免早期生成方法中常见的闪烁伪影。

Link to this sectionDiffusion Forcing 与标准扩散模型对比#

虽然它们共享基本去噪机制,但 Diffusion Forcing 与标准的 扩散模型 有明显区别。传统的扩散模型(如用于 文生图 生成的模型)通常同时对单个静态输出的所有像素或潜在变量进行去噪。相比之下,Diffusion Forcing 显式地对时间序列进行建模,迫使网络遵循因果序列顺序。这使其非常适合轨迹预测和 动作识别 等时间序列任务。

Link to this section在实践中集成序列处理#

尽管 Diffusion Forcing 主要应用于生成式序列任务,但在现代视觉流水线中,解释时间序列同样至关重要。例如,你可以使用 Ultralytics YOLO26 高效地跨序列视频帧跟踪对象,它在 目标跟踪 过程中原生处理时间一致性。

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for high-speed inference
model = YOLO("yolo26n.pt")

# Process a temporal sequence (video) to maintain consistent object identities
results = model.track(source="path/to/video.mp4", stream=True)

# Iterate through the sequence of frames
for frame_result in results:
    # Access temporal tracking IDs for objects in the current state
    print(f"Tracked {len(frame_result.boxes)} objects in the current frame.")

For teams looking to scale sequence data collection and train advanced vision models, the Ultralytics Platform provides robust cloud-based tools to manage complex datasets, track experiments, and deploy models natively to the edge. Whether you are experimenting with state-of-the-art causal transformers in PyTorch or deploying real-time tracking systems, mastering the intersection of spatial and temporal data is essential for the future of AI.

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅