词汇表

Stable Diffusion

探索 Stable Diffusion，这是一种先进的 AI 模型，可以通过文本提示生成逼真的图像，从而彻底改变创造力和效率。

稳定扩散是一个杰出的开源生成式人工智能模型，旨在创建详细的生成式人工智能模型，旨在根据文本描述创建详细的图像，这一过程被称为文本到图像的合成。由 Stability AI发布的，这种深度学习架构通过在配备强大功能的消费级硬件上高效运行，实现了该深度学习架构可在配备了功能强大的 GPU.与只能通过云服务访问的专有模型不同与只能通过云服务访问的专有模型不同，Stable Diffusion 的开放性允许研究人员和开发人员检查其代码、修改其权重，并构建从艺术工具到合成数据管道的定制应用程序。合成数据管道。

Stable Diffusion 的工作原理

稳定扩散模型的核心是一种扩散模型，特别是潜伏扩散模型（LDM 模型（LDM）。这一过程从热力学中汲取灵感，涉及学习如何逆转一个逐渐退化的过程。

前向扩散：系统从清晰的训练图像开始，逐步增加高斯噪声，直到图像变成随机静态图像。
反向扩散：A 训练神经网络，通常是 U-Net 来预测并逐步去除噪声，从而恢复原始图像。

稳定扩散技术的与众不同之处在于，它是在 "潜在空间"（一种压缩的而不是高维像素空间。这项技术在高分辨率图像合成研究论文中详细介绍的这一技术大大降低了计算需求，从而加快推理延迟和内存使用率。该模型利用文本编码器，如文本编码器，如提示转换为嵌入，从而指导去噪过程，确保最终输出与描述相匹配。过程，确保最终输出与描述相符。

将稳定扩散与相关概念区分开来

虽然稳定扩散技术经常与其他生成技术归为一类，但它具有鲜明的特点：

Vs.GANs：生成对抗网络（GANs）是以往图像生成的标准。然而，由于不稳定性和 "模式崩溃"（即模型生成的图像种类有限），GANs 的训练难度是众所周知的。和 "模式崩溃"（即模型生成的图像种类有限），因此训练 GANs 十分困难。稳定扩散提供了更高的训练稳定性和输出多样性，但通常代价是生成速度较慢。与 GAN 的单一前向传递相比。
与传统自动编码器相比传统自动编码器稳定扩散使用自编码器（特别是变异自编码器或 VAE 或 VAE）在像素空间和潜空间之间移动，但核心生成逻辑是扩散过程。标准的自动编码器主要用于压缩或去噪，不具备文本条件生成功能。

与 Vision AI 工作流程集成

对于使用Ultralytics Python API 的开发人员来说，Stable Diffusion 是一款强大的上游工具。您可以生成合成图像数据集，对其进行注释，然后使用它们来训练高性能视觉模型。

下面的示例演示了如何构建一个工作流程，在此流程中，YOLO11 模型将在一个数据集上进行训练。训练 YOLO11 模型：

from ultralytics import YOLO

# Load the YOLO11 model (recommended for latest state-of-the-art performance)
model = YOLO("yolo11n.pt")

# Train the model on a dataset.yaml that includes paths to your synthetic data
# This helps the model learn from diverse, generated scenarios
results = model.train(
    data="synthetic_dataset.yaml",  # Config file pointing to real + synthetic images
    epochs=50,
    imgsz=640,
)

这一工作流程凸显了生成式人工智能和判别式人工智能之间的协同作用：稳定扩散创建数据、像YOLO11 这样的模型从中学习，从而在现实世界中执行分类或检测等任务。分类或检测等任务。为了优化工程师通常会采用超参数调整，以确保模型很好地适应真实和合成特征的混合。

深度学习框架，如 PyTorch和 TensorFlow是运行这些模型的基础。随着随着技术的发展，我们看到生成和分析之间的整合越来越紧密，推动了人工智能人工智能的极限。

Stable Diffusion

培训Ultralytics YOLO 模型，以简化各行业的工作流程

灵活的企业许可解决方案，助力您的创新

使用Ultralytics YOLO在数秒内训练人工智能模型

Stable Diffusion 的工作原理

相关性和实际应用

将稳定扩散与相关概念区分开来

与 Vision AI 工作流程集成

阅读更多此类别的内容

未来物体检测趋势：需要关注的 7 个关键问题

利用Ultralytics YOLO 模型增强车辆再识别能力

利用Ultralytics YOLO 模型改进碰撞预测

加入Ultralytics 社区