深圳Yolo 视觉
深圳
立即加入
词汇表

自然语言理解 (NLU)

Explore [Natural Language Understanding (NLU)](https://www.ultralytics.com/glossary/natural-language-understanding-nlu) to learn how machines interpret human intent. Discover NLU applications in [YOLO26](https://docs.ultralytics.com/models/yolo26/) and the [Ultralytics Platform](https://platform.ultralytics.com).

自然语言理解(NLU)是人工智能(AI)的一个专业分支,专注于机器对人类语言的阅读理解与解读。虽然更广泛的技术能让计算机处理文本数据,但NLU能使系统具体把握词语背后的含义、意图和情感,驾驭语法、俚语和语境的复杂性。通过运用先进的 深度学习(DL)架构,NLU将非结构化文本转化为结构化、可被机器识别的逻辑体系,成为人类沟通与计算行动之间的桥梁。

自然语言理解的核心机制

为理解语言,自然语言理解算法将文本分解为组成部分并分析它们之间的关系。该过程涉及若干关键语言学概念:

  • 分词基础步骤 将原始文本分割为更小的单元,如单词或亚词。这为数据在神经网络中的数值表示做好准备。
  • 命名实体识别(NER) 自然语言理解模型能够识别句子中的特定实体,例如人物、地点、日期或组织。 例如,在短语"预订飞往伦敦的航班"中,"伦敦"会被提取为地点实体。
  • 意图分类:作为交互系统中的关键功能,该功能用于确定用户的目标。意图分类通过分析"我的网络断了"这类短语,理解用户是在报告技术问题而非提出一般性疑问。
  • 语义分析:超越简单关键词,该过程评估句式结构的含义。斯坦福NLP小组的研究人员长期致力于开创基于上下文消除词义歧义的方法,确保"bank"能根据周边文本正确解读为金融机构或河岸。

自然语言理解与相关学科

计算机科学领域中,必须将自然语言理解(NLU)与以下密切相关的领域区分开来:

  • 自然语言处理(NLP) NLP是涵盖自然语言理解(NLU)的总称。虽然NLP涵盖处理语言数据的完整流程——包括翻译和简单解析——但NLU严格来说仅涉及理解层面。另一个子领域自然语言生成(NLG)则负责创建新的文本响应。
  • 计算机视觉(CV) 传统上,CV处理视觉数据,而NLU处理文本。然而,现代多模态模型将这两门学科融合在一起。NLU解析文本提示(例如"找到那辆红色的车"),CV则基于该理解执行视觉搜索。
  • 语音识别也称为语音转文本技术,该技术将音频信号转换为书面文字。自然语言理解(NLU)仅在语音转录为文本后才介入,以解读所表达的内容。

实际应用

自然语言理解技术为众多智能系统提供支持,这些系统是企业与消费者日常依赖的重要工具。

  1. 智能客户支持: 现代聊天机器人利用自然语言理解技术,无需人工干预即可处理支持工单。通过情感分析功能,这些智能助手能detect 客户信息中的挫败情绪,并自动将问题升级至人工经理处理。
  2. 语义搜索引擎:与传统关键词搜索不同,基于自然语言理解(NLU)的引擎能够理解查询的上下文。企业采用语义搜索技术,使员工能够使用自然语言问题查询内部数据库,例如"请展示去年第四季度的销售报告",从而获得精准匹配的文档,而非一堆松散相关的文件列表。
  3. 视觉-语言融合:在视觉人工智能领域,自然语言理解(NLU)实现了"开放词汇物体检测"。这类模型(YOLO)不再受限于固定类别(如标准数据集中的80个分类),而是通过NLU理解自定义文本提示,从而在图像中定位指定物体。

代码示例:基于自然语言理解的物体检测

以下示例展示了如何将自然语言理解(NLU)概念整合到计算机视觉工作流中,使用... ultralytics 包。在此,我们采用一种结合文本编码器(NLU)与视觉骨干网络的模型, detect 仅由自然语言描述定义的detect 。

from ultralytics import YOLOWorld

# Load a model capable of vision-language understanding
# This model uses NLU to interpret text prompts
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using natural language descriptions
# The NLU component parses "person in red shirt" to guide detection
model.set_classes(["person in red shirt", "blue bus"])

# Run inference on an image
results = model.predict("city_street.jpg")

# Display the results
results[0].show()

工具和未来趋势

自然语言理解(NLU)的发展依赖于强大的框架。诸如PyTorch之类的库 PyTorch 提供了构建深度学习模型所需的tensor 功能,而spaCy则为语言处理提供了工业级别的强大工具。

展望未来,行业正朝着统一的多模态系统方向发展。Ultralytics 简化了这一演进过程,提供了一个全面的环境来管理数据集、标注图像并训练可部署到边缘的模型。 大型语言模型(LLMs)负责处理复杂推理,而将其与YOLO26等高速视觉模型集成,则能催生出具备实时感知、理解和交互能力的强大智能体。这种协同效应标志着机器学习(ML)应用的全新前沿。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入