深圳Yolo 视觉
深圳
立即加入
词汇表

生成式人工智能

探索生成式人工智能的基础原理。了解其如何创建合成数据、Ultralytics 集成,并推动计算机视觉领域的创新。

生成式人工智能(GenerativeAI)是人工智能(AI)的一个子领域,专注于根据用户提示生成新内容,如文本、图像、音频、视频和计算机代码。与主要设计用于分析或classify 传统人工智能系统不同,生成模型利用深度学习(DL)算法学习海量数据集中的潜在模式、结构和概率分布。 经过训练后,这些系统能够生成与训练数据具有统计相似性但独一无二的创新输出。这种能力使生成式AI成为现代基础模型的基石,推动着创意产业、软件开发及科学研究领域的创新发展。

生成式模型如何运作

生成式人工智能的核心是复杂的神经网络架构,它们能够学习编码和解码信息。这些模型通常通过在海量数据集上进行无监督学习来训练。

  • Transformers:对于文本和代码, Transformer 自注意力等机制 track 序列中远距离词语间的track 。这使得 大型语言模型(LLMs)能够生成 连贯且符合上下文的文本。
  • 扩散模型:在图像生成领域, 扩散模型通过向图像添加噪声直至其无法辨识, 再学习逆转此过程,从而从随机噪声中重建清晰图像。
  • 生成对抗网络(GANs): 生成对抗网络(GANs) 采用两个相互对抗的神经网络——生成器和鉴别器——通过竞争机制,促使生成器 产出越来越逼真的输出。

生成式人工智能与判别式人工智能

要理解生成式人工智能,关键在于将其与判别式人工智能区分开来。虽然它们都是机器学习的支柱,但二者的目标存在显著差异。

  • 生成式人工智能专注于创造。它通过建模各类数据的分布来生成新样本。例如,Stable Diffusion这类模型能根据文字描述生成新的狗的图像。
  • 判别式人工智能专注于分类与 预测。它通过学习类别的决策边界来对输入数据进行分类。高性能视觉模型如YOLO26属于判别式模型,其擅长通过分析图像识别并定位特定物体(例如在照片中检测到狗),而非直接生成图像本身。

实际应用

生成式人工智能的多功能性使其能够应用于多个领域,通常与判别式模型协同工作,从而构建出强大的工作流程。

  1. 合成数据生成:对计算机视觉工程师而言,最实用的应用之一便是 创建合成数据。 收集 罕见边缘案例的真实世界数据——例如特定工业缺陷或危险路况——可能 既危险又昂贵。生成模型能够为这些场景生成数千张逼真图像。这些数据 随后被用于训练YOLO26等鲁棒检测器, 从而提升其在现实环境中的识别精度。
  2. 创意设计与原型制作:在创意领域,基于文本转图像模型的工具使设计师能够快速将概念可视化。通过输入提示词,艺术家可生成产品设计、建筑布局或营销素材的多重变体,显著加速创意构思阶段。
  3. 代码生成与调试:基于代码库训练的模型正重塑软件开发模式。这些辅助工具通过提供代码片段、编写文档乃至识别缺陷,为开发者提供支持,从而优化软件生命周期。

与计算机视觉的协同效应

生成式人工智能与判别式计算机视觉模型常作为互补技术协同运作。常见的工作流程包括:先利用生成模型扩充数据集,再Ultralytics 等工具,基于该增强数据集训练判别模型。

下面的Python 示例演示了如何使用 ultralytics 用于加载YOLO26模型的包。在混合工作流中,您可能使用此代码对合成图像中的物体进行验证。

from ultralytics import YOLO

# Load the YOLO26 model (Latest stable Ultralytics model)
model = YOLO("yolo26n.pt")

# Run inference on an image (e.g., a synthetic sample from a generative model)
# The model identifies objects within the generated content
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results to verify the synthetic data quality
results[0].show()

挑战与考量

尽管强大,生成式人工智能仍给用户带来了特定挑战。模型偶尔会产生幻觉,生成看似合理却事实错误的信息或视觉伪像。此外,由于这些模型是在互联网规模的数据上训练的,它们可能会无意中传播源材料中存在的偏见

关于版权和知识产权的伦理问题同样备受关注,正如各类人工智能伦理框架所探讨的那样。斯坦福大学以人为本人工智能研究所等研究机构正积极探索方法,确保这些强大工具的开发与部署符合责任规范。此外,训练这些庞大模型的计算成本高昂,促使业界日益关注模型量化技术,以提升边缘设备上推理的能效表现。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入