深圳Yolo 视觉
深圳
立即加入
词汇表

一致性模型

了解一致性模型如何通过单一步骤实现快速、高质量的生成式人工智能。了解它们在实时推理方面与扩散模型有何不同。

生成式人工智能在视觉保真度方面取得了巨大飞跃,但处理速度往往仍是 一个瓶颈。一致性模型是一类先进的 生成式人工智能架构,旨在通过单一步骤或极少步骤生成 高质量数据,从而绕过了早期概率框架所需的 计算成本高昂的采样过程。 该方法最初由OpenAI在基础 机器学习研究中提出, 为快速数据合成树立了新标准。

与通过数百个步骤逐步去除噪声不同,这些网络学习了一种数学映射, 能够将任何带噪声的数据点直接映射回其干净的原始形式。通过沿特定噪声轨迹求解 常微分方程(ODEs), 该模型确保沿该路径的所有点都能映射到完全相同的最终 输出。这种“一致性”特性使从业者能够完全跳过中间步骤。 受 Google 更广泛创新成果的启发,近期 诸如潜在一致性模型(LCMs) 等突破性进展进一步优化了 这一过程。通过在压缩的潜在空间中运行,LCMs大幅降低了内存需求,并 加速了文本到图像的生成流程。

一致性模型与扩散模型

将该架构与 扩散模型相比,主要区别在于 生成时间线。传统扩散框架依赖渐进式的迭代去噪循环来 构建图像,而一致性模型则是专门为 实时推理而设计的。 扩散模型虽能 呈现惊人的细节,但其运行速度往往过慢,难以满足面向用户的实时应用需求,因此当项目对 推理延迟有严格要求时,基于一致性的新型方法 便成为首选方案。

实际应用

即时生成高保真输出的能力,为各行各业带来了新的可能性: 包括:

现代计算机视觉中的速度

对低延迟执行的追求不仅限于 生成式媒体;这是所有 计算机视觉领域共同的 目标。例如Ultralytics 完全 专为原生端到端效率而设计。通过消除后处理瓶颈,它能够 同时支持 目标检测和复杂 图像分割任务的实时计算。 为了实现更全面的 模型优化,开发者 可以借助 Ultralytics 轻松管理数据集、快速训练模型并进行部署。

以下代码示例演示了如何使用高度优化的 yolo26n.pt 模型,通过 PyTorch 以 满足现代工业对快速 机器学习运算:

from ultralytics import YOLO

# Load the lightning-fast YOLO26 nano model for low-latency visual tasks
model = YOLO("yolo26n.pt")

# Perform a rapid, single-step prediction on an input image using GPU acceleration
results = model.predict(source="image.jpg", conf=0.5, device="cuda")

让我们一起共建AI的未来!

开启您的机器学习未来之旅