遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Language Modeling

探索语言建模的基础知识及其在 NLP 中的作用。了解 Ultralytics YOLO26 和多模态 AI 如何弥合文本与视觉之间的鸿沟。

语言建模是用于训练计算机理解、生成和预测人类语言的核心统计技术。在最基本的层面上,语言模型决定了句子中特定单词序列出现的概率。这种能力是整个自然语言处理 (NLP) 领域的基础,使机器能够超越简单的关键词匹配,进而理解语境、语法和意图。通过分析海量的训练数据,这些系统学习到了哪些单词通常会出现在其他单词之后的统计可能性,从而使它们能够构建连贯的句子或在语音识别任务中破译模糊的音频。

Link to this section机制与演变#

语言建模的历史追踪了人工智能 (AI) 本身的演变。早期迭代依赖于“n-gram”,它仅根据紧随其后的 $n$ 个单词计算单词的统计概率。然而,现代方法利用深度学习 (DL) 来捕获更复杂的关系。

现代模型利用嵌入 (embeddings),将单词转换为高维向量,使系统能够理解“国王”和“女王”在语义上是相关的。这一演变最终形成了 Transformer 架构,它利用自注意力 (self-attention) 机制并行处理整个文本序列。这使得模型能够权衡单词的重要性,而不受它们在段落中相互距离的影响,这是在长文本文本生成中保持上下文的关键特性。

Link to this section实际应用#

语言建模已从学术研究转型为驱动各行业日常数字交互的实用工具:

  • 机器翻译 诸如 Google Translate 之类的服务使用先进的序列到序列模型将文本从一种语言转换为另一种语言。该模型根据源语言序列预测目标语言序列的概率,从而确保语法的准确性。
  • 智能编码助手: GitHub Copilot 等工具充当了在代码仓库上训练的专业语言模型。它们预测语法和逻辑以自动补全代码块,从而显著加快软件开发速度。
  • 预测文本和自动更正: 在移动设备上,轻量级模型在本地执行推理,以建议消息中的下一个单词,并随着时间的推移适应用户的特定打字风格。
  • 视觉-语言集成:计算机视觉 (CV) 领域,语言模型与视觉编码器相结合。这实现了“开放词汇”检测,用户可以使用自然语言描述而非预定义的类别来搜索对象。

Link to this section连接文本与视觉#

虽然语言建模主要处理文本,但其原理正越来越多地应用于多模态 AI。像 YOLO-World 这样的模型集成了语言能力,允许用户使用文本提示动态定义检测类。这消除了在搜索新对象时重新训练的需要。

以下 Python 代码片段演示了如何使用 ultralytics 包来利用语言描述进行对象检测:

from ultralytics import YOLOWorld

# Load a model capable of understanding natural language prompts
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using text descriptions via the language model encoder
# The model uses internal embeddings to map 'text' to 'visual features'
model.set_classes(["person in red shirt", "blue car"])

# Run inference to detect these specific text-defined objects
results = model.predict("street_scene.jpg")

# Display the results
results[0].show()

Link to this section区分相关概念#

区分语言建模与常被混用的相关术语很有帮助:

  • 语言建模 vs. 大语言模型 (LLMs) 语言建模是基础的任务或数学技术。LLM(例如 GPT 系列)是旨在执行此任务的特定、庞大的模型实例,在数拍字节的数据和数十亿个参数上进行训练。
  • 语言建模 vs. 生成式 AI 生成式 AI 是一个广泛的类别,包含任何创建新内容(图像、音频、代码)的 AI。语言建模是实现生成式 AI 中文本子集的特定机制。
  • 语言建模 vs. 目标检测 传统的检测模型(如 YOLO26)是在固定的视觉标签上训练的。语言模型处理文本中的序列概率。然而,CLIP 等技术通过学习将视觉概念与语言描述相关联来弥合这一差距。

Link to this section挑战与未来展望#

尽管语言模型具有实用性,但它们在 AI 偏见方面面临挑战,因为它们可能会无意中重现训练数据集中存在的偏见。此外,训练这些模型需要巨大的计算资源。诸如 Ultralytics Platform 之类的解决方案有助于简化数据集和训练工作流的管理,使针对特定应用微调模型变得更加容易。未来的研究重点是通过模型量化使这些模型更高效,从而允许强大的语言理解能力直接在边缘 AI 设备上运行,而无需依赖云连接。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅