遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Flow Matching

探索流匹配 (Flow Matching),这是一种将噪声转化为数据的生成建模框架。了解它如何凭借更快、高质量的推理胜过扩散模型。

Flow matching 是一种生成式建模框架,它通过直接模拟数据点随时间变化的连续流动,学习将简单的噪声分布转换为复杂的数据分布。与依赖复杂、多步去噪过程的传统方法不同,flow matching 定义了一条更简单、更直接的路径(通常是一条直线),连接源分布(噪声)和目标分布(数据)。这种方法显著简化了 generative AI 模型的训练,从而实现更快的收敛、更高的稳定性和更高质量的输出。通过学习一种将概率密度从先验状态推向目标数据状态的矢量场,它为标准的 diffusion models 提供了一种强大的替代方案。

Link to this section核心概念与机制#

Flow matching 的核心在于,它通过关注数据转换的速度而非仅仅关注边缘概率,从而简化了生成过程。该方法借鉴了连续归一化流 (continuous normalizing flows) 的思想,但避免了计算精确似然带来的高昂计算成本。

  • Vector Fields Flow matching 的核心组件是一个神经网络,它能预测空间和时间中任意给定点的速度矢量。该矢量会引导数据点向实现真实样本的方向移动。
  • 最优传输 (Optimal Transport): Flow matching 通常旨在找到将质量从一个分布传输到另一个分布的最有效路径。通过最小化移动距离,模型可以实现更快的推理速度。诸如 optimal transport 之类的技术有助于定义这些直线路径,确保噪声以几何一致的方式映射到数据。
  • 条件生成:Ultralytics YOLO26 根据输入图像进行检测类似,flow matching 也可以根据类别标签或文本提示进行条件生成。这实现了对生成内容的精确控制,是现代 text-to-imagetext-to-video 流水线的关键特性。

Link to this sectionFlow Matching 与 Diffusion Models 的对比#

虽然 flow matching 和 diffusion models 都用于生成式建模,但它们在数学公式和训练效率上有所不同。

  • Diffusion Models: 这些模型通常依赖于随机微分方程 (SDE),该方程会逐渐向数据添加噪声,然后学习反转此过程。反转路径通常是弯曲的,并且在 inference 期间需要许多离散步骤,这会减慢生成速度。
  • Flow Matching: 这种方法本质上“拉直”了噪声和数据之间的轨迹。通过学习具有更直路径的确定性常微分方程 (ODE),flow matching 允许在采样期间使用更大的步长。这直接转化为更快的生成速度且不会牺牲质量,解决了 real-time inference 场景中的一个主要瓶颈。

Link to this section实际应用#

Flow matching 的效率和高保真度使其在各种尖端 AI 领域得到迅速采用。

  • 高分辨率图像合成: Flow matching 正越来越多地被用于驱动最先进的图像生成器。通过实现更直的轨迹,这些模型能够以比 Stable Diffusion 等旧架构更少的采样步骤生成逼真的图像。这种效率对于在消费级硬件或 Ultralytics Platform 中部署用于数据增强的生成工具至关重要。
  • 生成式语音和音频:speech synthesis 领域,flow matching 可以生成非常自然的类人语音。它能比自回归模型更有效地模拟音高和语调的连续变化,从而产生更流畅、更具表现力的 text-to-speech 系统。
  • 3D 点云生成: 生成 3D 资产需要对复杂的空间关系进行建模。Flow matching 能有效扩展到更高维度,因此适用于创建详细的 3D object detection 数据集或虚拟环境中的资产。

Link to this section实现 Flow Matching 概念#

虽然 flow matching 涉及复杂的训练循环,但转换噪声的概念可以通过基本的张量运算进行可视化。以下示例演示了一个简化的概念,即使用方向向量将点从噪声分布移向目标,这类似于 flow matching 矢量场引导数据的方式。

import torch

# Simulate 'noise' data (source distribution)
noise = torch.randn(5, 2)

# Simulate 'target' data means (destination distribution)
target_means = torch.tensor([[2.0, 2.0], [-2.0, -2.0], [2.0, -2.0], [-2.0, 2.0], [0.0, 0.0]])

# Calculate a simple linear path (velocity) from noise to target
# In a real Flow Matching model, a neural network predicts this velocity
time_step = 0.5  # Move halfway
velocity = target_means - noise
next_state = noise + velocity * time_step

print(f"Start:\n{noise}\nNext State (t={time_step}):\n{next_state}")

Link to this section未来方向与研究#

截至 2025 年,flow matching 持续演进,研究重点在于将这些模型扩展到更大的数据集和更复杂的模态。研究人员正在探讨如何将 flow matching 与 large language models 相结合,以提高生成任务中的语义理解能力。此外,将 flow matching 集成到视频生成流水线中,正在为实现更好的时间一致性铺平道路,解决 AI 生成视频中常见的“闪烁”问题。这符合行业向能够无缝处理多模态任务的统一 foundation models 发展的更广泛趋势。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅