遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Generative AI

探索生成式 AI 的基础知识。了解它如何创建合成数据、与 Ultralytics YOLO26 集成,并推动计算机视觉的创新。

生成式 AI 是 人工智能 (AI) 的一个子集,专注于根据用户提示创建诸如文本、图像、音频、视频和计算机代码等新内容。与主要旨在分析或分类现有数据的传统 AI 系统不同,生成模型使用 深度学习 (DL) 算法来学习海量数据集中潜在的模式、结构和概率分布。一旦训练完成,这些系统就能生成与训练数据具有统计相似性但又是独特创作的全新输出。这种能力使生成式 AI 成为现代 基础模型 的基石,推动了创意产业、软件开发和科学研究领域的创新。

Link to this section生成模型的工作原理#

生成式 AI 的核心是能够学习编码和解码信息的复杂 神经网络 架构。这些模型通常使用 无监督学习 对海量数据集进行训练。

  • Transformer: 对于文本和代码,Transformer 架构 利用自注意力等机制来追踪序列中跨越长距离的词与词之间的关系。这使得 大语言模型 (LLM) 能够生成连贯且语境相关的文本。
  • 扩散模型: 对于图像生成,扩散模型 的工作原理是向图像添加噪声直到其无法辨认,然后学习逆转此过程,从而从随机噪声中重建清晰的图像。
  • GAN: 生成对抗网络 (GAN) 使用两个相互竞争的神经网络——生成器和判别器,从而推动生成器产生越来越逼真的输出。

Link to this section生成式 AI 与判别式 AI#

要理解生成式 AI,将其与 判别式 AI 区分开来至关重要。虽然两者都是机器学习的支柱,但它们的目标大不相同。

  • 生成式 AI 专注于 创造。它对各类别的分布进行建模以生成新的样本。例如,像 Stable Diffusion 这样的模型可以根据文本描述生成一张新的狗的图像。
  • 判别式 AI 专注于 分类预测。它学习类别之间的决策边界以对输入数据进行分类。像 YOLO26 这样的高性能视觉模型就是判别式的;它们擅长 目标检测,通过分析图像来识别和定位特定对象(例如,检测照片中的狗),而不是创建图像本身。

Link to this section实际应用#

生成式 AI 的多功能性使其能够应用于各个领域,通常与判别模型结合使用,以创建强大的工作流程。

  1. 合成数据生成: 对于计算机视觉工程师来说,最实用的应用之一是创建 合成数据。为罕见的边缘情况收集真实数据(例如特定的工业缺陷或危险的道路状况)可能既危险又昂贵。生成模型可以产生数千张这些场景的照片级真实图像。这些数据随后被用于训练像 YOLO26 这样强大的检测器,从而提高它们在现实世界中的准确性。

  2. 创意设计与原型制作: 在创意领域,由 文生图 模型驱动的工具允许设计师快速可视化概念。通过输入提示词,艺术家可以生成多种产品设计、建筑布局或营销素材的变体,从而显著加速构思阶段。

  3. 代码生成与调试: 软件开发已被在代码库上训练的模型所改变。这些助手通过建议代码片段、编写文档甚至识别 Bug 来帮助开发人员,从而简化了软件生命周期。

Link to this section与计算机视觉的协同作用#

生成式 AI 和判别式计算机视觉模型通常作为互补技术发挥作用。一种常见的流水线是使用生成模型来增强数据集,然后使用 Ultralytics Platform 等工具在增强后的数据集上训练判别模型。

以下 Python 示例演示了如何使用 ultralytics 包来加载 YOLO26 模型。在混合工作流程中,你可以使用此代码来验证合成生成的图像中的对象。

from ultralytics import YOLO

# Load the YOLO26 model (Latest stable Ultralytics model)
model = YOLO("yolo26n.pt")

# Run inference on an image (e.g., a synthetic sample from a generative model)
# The model identifies objects within the generated content
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results to verify the synthetic data quality
results[0].show()

Link to this section挑战与注意事项#

虽然生成式 AI 功能强大,但也引入了用户必须应对的特定挑战。模型有时会产生 幻觉,创造出听起来合理但事实错误的信息或视觉伪影。此外,由于这些模型是在互联网规模的数据上进行训练的,它们可能会无意中传播原始材料中存在的 AI 偏见

关于版权和知识产权的伦理问题也十分突出,各种 AI 伦理 框架中都有所讨论。研究人员和机构(例如 斯坦福以人为本人工智能研究院)正在积极研究确保这些强大工具得到负责任开发和部署的方法。此外,训练这些大型模型的计算成本导致人们对 模型量化 的兴趣日益增加,旨在使推理在边缘设备上更具能效。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅