遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Large Language Model (LLM)

探索大型语言模型 (LLM) 的基础知识。了解 Transformer 架构、分词,以及如何将 LLM 与 Ultralytics YOLO26 结合。

大语言模型 (LLM) 是一种先进的 人工智能 (AI),通过在海量数据集上进行训练,能够理解、生成并处理人类语言。这些模型代表了 深度学习 (DL) 的重大演进,利用拥有数十亿参数的神经网络来捕捉复杂的语言模式、语法和语义关系。大多数现代 LLM 的核心都依赖于 Transformer 架构,该架构使它们能够并行而非顺序地处理数据序列。该架构采用了一种 自注意力机制,使模型能够权衡句子中不同单词之间的重要性,而无需考虑它们在文本中的距离。

Link to this sectionLLM 的核心机制#

LLM 的功能始于 分词 (tokenization),这是一个将原始文本分解为更小单位(称为 token,即单词或子词)的过程。在 模型训练 阶段,系统会分析来自互联网、书籍和文章的 PB 级文本。它通过 无监督学习 来预测序列中的下一个 token,从而有效地学习语言的统计结构。

在初始训练之后,开发者通常会应用 微调 (fine-tuning) 来使模型专门针对特定任务(如医学分析或代码辅助)进行优化。这种适应性是 斯坦福基础模型研究中心 等机构将其归类为“基础模型”的原因——它们是构建特定应用程序的宽广基础。

Link to this section实际应用#

LLM 已从理论研究转向各行各业中实用且影响深远的应用:

  • 智能虚拟助理: 现代客户服务在很大程度上依赖于由 LLM 驱动的 聊天机器人 (chatbots)。与旧式的基于规则的系统不同,这些智能体能够处理细微复杂的查询。为了提高准确性并减少 幻觉 (hallucinations),开发者集成了 检索增强生成 (RAG),允许模型在回答之前引用外部最新的公司文档。
  • 多模态视觉语言系统: AI 的前沿领域正在将文本与视觉数据连接起来。视觉语言模型 (VLM) 允许用户使用自然语言查询图像。例如,将语言界面与像 YOLO26 这样强大的检测器相结合,使系统能够根据语音指令在实时视频流中识别并描述对象。

Link to this section用代码连接文本与视觉#

虽然标准的 LLM 处理文本,但行业正在转向 多模态 AI (Multimodal AI)。以下示例展示了如何使用 YOLO-World 通过语言提示控制计算机视觉任务,该模型能够理解用于开放词汇检测的文本描述符。

from ultralytics import YOLOWorld

# Load a model capable of understanding natural language prompts
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using text descriptions rather than fixed labels
model.set_classes(["person wearing a red helmet", "blue industrial machine"])

# Run inference to detect these specific text-defined objects
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Show results
results[0].show()

Link to this section区分相关概念#

区分 LLM 与更广泛或平行术语非常重要:

  • LLM 与 自然语言处理 (NLP) 的区别: NLP 是关注计算机与人类语言交互的总体学术领域。而 LLM 是该领域内用于实现最先进结果的一种特定 工具技术
  • LLM 与 生成式 AI (Generative AI) 的区别: 生成式 AI 是一个涵盖任何能够创建新内容的 AI 的类别。LLM 是该类别中基于文本的子集,而像 Stable Diffusion 这样的模型则代表了图像生成子集。

Link to this section挑战与未来展望#

尽管 LLM 功能强大,但它们在 AI 偏见 (bias in AI) 方面面临挑战,因为它们可能会无意中复制训练数据中存在的偏见。此外,训练像 GPT-4Google Gemini 这样的模型所需的大规模计算能力引起了对能源消耗的担忧。目前的研究重点是 模型量化 (model quantization),以使这些系统足够高效,从而能够在边缘硬件上运行。

如需深入了解技术见解,原始论文 Attention Is All You Need 提供了 Transformer 的基础理论。你还可以探索 NVIDIA 如何为这些大规模工作负载优化硬件。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅