深圳Yolo 视觉
深圳
立即加入
词汇表

生成式人工智能

探索生成式AI的基础知识。了解它如何创建合成数据、如何与Ultralytics YOLO26集成,以及如何推动计算机视觉领域的创新。

生成式AI是指 人工智能 (AI) 的一个子集,专注于响应用户提示创建新内容,例如文本、图像、音频、视频和计算机代码。与主要设计用于分析或 classify 现有数据的传统AI系统不同,生成模型使用 深度学习 (DL) 算法来学习海量数据集的底层模式、结构和概率分布。一旦训练完成,这些系统就能生成新颖的输出,这些输出与训练数据具有统计相似性,但却是独特的创作。这一能力使生成式AI成为现代 基础模型 的基石,推动了创意产业、软件开发和科学研究的创新。

生成模型的工作原理

生成式AI的核心是复杂的 神经网络 架构,它们学习编码和解码信息。这些模型通常使用 无监督学习 在海量数据集上进行训练。

  • Transformer:对于文本和代码, Transformer 架构利用自注意力等机制来 track 序列中词语之间的长距离关系。这使得 大型语言模型 (LLM)能够生成连贯且上下文相关的文本。
  • 扩散模型:对于图像生成,扩散模型通过向图像添加噪声直到其无法识别来工作,然后学习逆转此过程,从随机噪声中重建清晰图像。
  • GANs:生成对抗网络 (GANs)采用两个相互竞争的神经网络——一个生成器和一个判别器,促使生成器产生越来越逼真的输出。

生成式人工智能与判别式人工智能

要理解生成式AI,将其与判别式AI区分开来至关重要。尽管它们都是机器学习的支柱,但它们的目标显著不同。

  • 生成式 AI 专注于 创作。它通过建模各个类别的分布来生成新的样本。例如,像 Stable Diffusion 这样的模型可以根据文本描述生成一张新的狗的图像。
  • 判别式AI侧重于分类预测。它学习类别之间的决策边界以对输入数据进行分类。像YOLO26这样的高性能视觉模型是判别式的;它们擅长通过分析图像来识别和定位特定物体进行目标检测(例如,在照片中 detect 一只狗),而不是创建图像本身。

实际应用

生成式AI的多功能性使其能够应用于各种领域,通常与判别模型协同工作,以创建强大的工作流程。

  1. 合成数据生成:对于计算机视觉工程师而言,最实用的应用之一是创建合成数据。收集针对罕见边缘情况(例如特定的工业缺陷或危险的道路状况)的真实世界数据可能既危险又昂贵。生成模型可以生成数千张这些场景的逼真图像。这些数据随后用于训练像YOLO26这样的鲁棒 detect 器,从而提高它们在现实世界中的准确性。
  2. 创意设计与原型制作: 在创意领域,由 文本到图像模型驱动的工具使设计师能够快速 可视化概念。通过输入提示,艺术家可以生成产品设计、 建筑布局或营销素材的多种变体,显著加速构思阶段。
  3. 代码生成与调试: 软件开发已因在代码仓库上训练的模型而发生转变。这些助手通过建议代码片段、编写文档甚至识别错误来帮助开发人员,从而简化了软件生命周期。

与计算机视觉的协同效应

生成式AI和判别式计算机视觉模型通常作为互补技术发挥作用。一个常见的流程是使用生成模型来扩充数据集,然后使用 Ultralytics Platform 等工具在该增强数据集上训练判别模型。

下面的Python 示例演示了如何使用 ultralytics 包来加载 YOLO26 模型。在混合工作流程中,您可以使用此代码来验证合成生成的图像中的对象。

from ultralytics import YOLO

# Load the YOLO26 model (Latest stable Ultralytics model)
model = YOLO("yolo26n.pt")

# Run inference on an image (e.g., a synthetic sample from a generative model)
# The model identifies objects within the generated content
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results to verify the synthetic data quality
results[0].show()

挑战与考量

尽管生成式AI功能强大,但它也带来了一些用户必须应对的特定挑战。模型有时会产生幻觉,生成听起来合理但事实不正确的信息或视觉伪影。此外,由于这些模型是在互联网规模的数据上训练的,它们可能会无意中传播源材料中存在的AI偏见

正如各种 AI伦理框架所讨论的那样,版权和知识产权方面的伦理问题也十分突出。斯坦福大学以人为本人工智能研究院等研究人员和组织正在积极研究方法,以确保这些强大的工具能够负责任地开发和部署。此外,训练这些大型模型的计算成本,使得人们对 模型量化的兴趣日益增长,以使边缘设备上的推理更加节能。

让我们一起共建AI的未来!

开启您的机器学习未来之旅