遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Generative Adversarial Network (GAN)

探索生成对抗网络 (GAN) 如何创建逼真的合成数据。学习使用 GAN 增强的数据集训练 Ultralytics YOLO26 以用于视觉 AI。

生成对抗网络 (GAN) 是 人工智能 (AI) 领域内的一种先进框架,旨在生成与你训练数据相似的新数据实例。GAN 由 Ian Goodfellow 及其同事于 2014 年在一篇 开创性论文 中首次提出,其运行基于两个不同的 神经网络 之间的竞争原理。这种架构已成为现代 生成式 AI 的基石,能够实现照片级真实图像的创作、视频增强,以及为复杂的机器学习任务合成多样化的训练数据集。

Link to this section对抗架构#

GAN 的核心机制涉及两个同时训练的模型,它们在一个零和博弈中相互竞争,这通常可以用伪造者和侦探的比喻来描述。

  • 生成器 (Generator): 该网络扮演“伪造者”的角色。它以随机噪声(潜向量)作为输入,并试图生成看起来真实的图像等数据。其主要目标是欺骗判别器,使其相信生成的输出是真实的。这一过程对于创建高质量的 合成数据 至关重要。
  • 判别器 (Discriminator): 该网络扮演“侦探”的角色,负责评估输入,以区分来自 训练数据 的真实样本和由生成器产生的伪造样本。它作为一个标准的二元分类器运行,输出输入为真实样本的概率。

在训练过程中,生成器会最小化判别器做出正确分类的概率,而判别器则会最大化这一概率。这种对抗性循环会一直持续,直到系统达到 纳什均衡 (Nash Equilibrium),即生成器生成的数据非常逼真,以至于判别器无法将其与现实世界的数据区分开来。

Link to this section视觉 AI 的实际应用#

GAN 已超越学术理论,开始在各个行业解决实际问题,尤其是在 计算机视觉 领域。

  1. 用于模型训练的数据增强: 在数据稀缺或涉及隐私敏感的场景中,例如 医学图像分析,GAN 被用于生成逼真的合成示例。例如,创建合成 MRI 扫描使研究人员能够在不损害患者隐私的情况下训练鲁棒的诊断模型。该技术对 自动驾驶车辆 也至关重要,GAN 可以模拟罕见的天气条件或交通场景以提高安全性。

  2. 超分辨率和图像增强: GAN 在 超分辨率 方面非常有效,这是一种将低分辨率图像提升至高清,同时补全合理细节的处理过程。该技术被广泛用于修复历史档案、增强用于 全球测绘 的卫星图像,以及改善视频流质量。

  3. 风格迁移: 该应用允许将一幅图像的美学风格应用到另一幅图像的内容上。像 CycleGAN 这样的工具可以实现诸如将白天照片转换为夜间场景,或将草图转换为照片级真实产品模型等转换,从而简化 时尚零售中的 AI 工作流程。

Link to this sectionGAN 与扩散模型的区别#

While both are generative technologies, it is important to distinguish GANs from diffusion models like those used in Stable Diffusion.

  • 推理速度: GAN 通常在单次前向传播中生成数据,这使得它们在 实时推理 方面显著更快。
  • 训练稳定性: 扩散模型通过迭代去除图像中的噪声来运行,这通常能带来更稳定的训练和更高的模式覆盖率(多样性)。相比之下,GAN 可能会遭遇“模式崩溃”,即生成器产生的输出种类有限,尽管像 Wasserstein GAN (WGAN) 这样的技术有助于缓解这一问题。

Link to this section将 GAN 生成的数据与 YOLO 集成#

GAN 的一个强大用例是生成合成数据集,用于训练像 YOLO26 这样的目标检测模型。如果你缺乏特定缺陷或物体的真实世界图像,GAN 可以生成数千种带有标注的变体。然后,你可以使用 Ultralytics Platform 来管理这些数据集并训练你的模型。

以下示例演示了如何加载 YOLO26 模型进行数据集训练,其中可以无缝包含由 GAN 生成的合成图像以提升性能:

from ultralytics import YOLO

# Load the YOLO26 model (Latest stable Ultralytics model)
model = YOLO("yolo26n.pt")

# Train the model on a dataset configuration file
# The dataset path defined in 'coco8.yaml' can contain both real and GAN-generated images
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

# Verify the model performance on validation data
metrics = model.val()

Link to this section挑战与注意事项#

尽管 GAN 功能强大,但训练它们需要仔细的 超参数调优。如果判别器学习过快,无法为生成器提供有意义的反馈,则可能会出现 梯度消失 等问题。此外,随着 GAN 在创建 深度伪造 (deepfakes) 方面的能力日益增强,行业正日益关注 AI 伦理 以及开发检测 AI 生成内容的方法。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅