深圳尤洛视觉
深圳
立即加入
词汇表

生成式人工智能

了解生成式人工智能如何创建文本、图像和音频等原创内容,通过创新应用改变行业。

生成式 AI 是一类 人工智能 (AI) 系统,可以创建新的和原创的内容,包括文本、图像、音频和视频。与分析现有数据或对其采取行动的传统 AI 不同,生成模型从大量的 训练数据 中学习潜在的模式和结构,以生成模仿其训练数据特征的新颖输出。这项技术由复杂的 深度学习 模型(例如 大型语言模型 (LLM))提供支持,这些模型已变得越来越容易访问且功能强大。

生成式人工智能如何工作?

从本质上讲,生成式 AI 依赖于在海量数据集上训练的神经网络 (NN)。在训练期间,模型学习数据的概率分布。当给定提示或输入时,它会使用这种学习到的分布来预测和生成序列中下一个最可能的元素,无论是单词、像素还是音符。重复此过程以构建完整的内容。许多现代生成模型都建立在 Transformer 架构之上,该架构使用注意力机制来权衡输入数据不同部分的重要性,使其能够捕获复杂的长程依赖关系并生成高度连贯的输出。这些强大的预训练模型通常被称为基础模型

生成式 AI 与判别式 AI

生成式 AI 的对应物是判别式 AI。它们之间的主要区别在于它们的目标:

  • 生成模型: 学习数据的分布以创建新的数据样本。他们的目标是回答“数据看起来像什么?”这个问题。示例包括文本到图像合成或文本生成模型。
  • 判别模型: 学习不同数据类别之间的边界,以便分类预测给定输入的标签。 它们的目标是回答“这些组之间有什么区别?”。 监督学习中的大多数任务,例如图像分类目标检测,都属于这一类,由诸如Ultralytics YOLO之类的模型执行。

虽然判别模型非常适合分类和预测,但生成模型擅长创建和增强。

实际应用

生成式 AI 正在通过广泛的应用改变着众多行业:

  1. 内容创作与增强:像GPT-4这样的模型可以撰写文章、电子邮件和代码,而像文生图像模型DALL-E 3和Midjourney可以通过简单的文本描述创建令人惊叹的视觉效果。这正在彻底改变从营销和娱乐到软件开发等领域,像GitHub Copilot这样的工具正在协助开发人员。
  2. 合成数据生成:生成式 AI 可以创建逼真的人工数据来训练其他机器学习 (ML)模型。例如,在汽车人工智能中,它可以生成罕见的驾驶场景,以提高自动驾驶汽车中感知模型的鲁棒性。同样,在医疗保健领域,它可以生成用于训练诊断工具的合成医学图像,从而帮助克服与数据隐私和有限的数据集相关的挑战。这种技术是对传统数据增强的补充。

常见生成模型类型

以下几种架构在生成式 AI 的发展中起到了关键作用:

  • 生成对抗网络 (GANs): 由两个相互竞争的神经网络(一个生成器和一个判别器)组成,它们协同工作以创建高度逼真的输出。
  • 扩散模型:逐渐向图像添加噪声,然后学习反转该过程以生成高保真图像。这是Stable Diffusion等模型背后的技术。
  • 大型语言模型(LLM):这些模型基于 Transformer 架构,经过大量文本数据的训练,能够理解和生成类似人类的语言。诸如Google AIMeta AI等领先的研究机构正在不断突破可能的界限。

挑战与伦理考量

生成式人工智能的迅速崛起带来了一系列严峻的挑战。潜在的滥用风险,例如制造用于虚假宣传的 深度伪造 内容或侵犯知识产权,是人们主要关注的问题。模型还可能延续和放大训练数据中存在的算法偏差。要解决这些问题,需要坚定地遵守人工智能伦理,并建立健全的治理框架。此外,训练这些大型模型需要大量的计算资源,这引发了人们对其环境影响的担忧。通过 MLOps 平台(如 Ultralytics HUB)高效管理模型生命周期有助于简化开发和部署

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板