深圳Yolo 视觉
深圳
立即加入
词汇表

自然语言理解 (NLU)

探索自然语言理解 (NLU) —— 这项 AI 突破使机器能够理解、解释和响应人类语言。

自然语言理解(NLU)是人工智能(AI)的一个专门子领域。 自然语言理解NLU)是人工智能(AI)的一个专门子领域,侧重于 机器阅读理解。标准的文本处理可以计算字数,而自然语言理解则旨在解读人类语言背后的意义、意图和情感。 人类语言背后的含义、意图和情感。它是 "大脑",能让软件 解读非结构化文本,如电子邮件、聊天记录或口语命令,并将其转化为结构化、可操作的数据。 数据。这种能力是构建直观系统(如 聊天机器人虚拟助手等直观系统的基础。 自然地与用户互动。

NLU 的核心组成部分

为了有效地 "理解 "语言,NLU 系统将输入分解成几个有意义的层次。这一 这一过程将原始文本转换为算法可以使用的结构化格式。

  • 意图识别: 这可以确定用户的目标。例如,如果用户输入 "我需要一架 飞往东京",其意图是 BookFlight.这对以目标为导向的人工智能代理至关重要。
  • 命名实体识别(NER) 这可以提取特定的信息,如姓名、日期、地点或产品代码。在短语 "周五与格伦会面 "中,NER 将 "格伦 "识别为 PERSON 和 和 "星期五 "作为 DATE.
  • 情感分析这 评估文本的情感基调--积极、消极或中性。它广泛应用于客户支持 自动评估用户满意度。
  • 语境推理:高级 NLU 通常由 大型语言模型(LLM)转换器,超越单个句子的范围 例如,理解 "它 "在对话中指的是什么)。

实际应用

NLU 是我们日常使用的许多技术背后的引擎,它在人类交流和机器逻辑之间架起了一座桥梁。 逻辑之间的桥梁。

  1. 客户服务自动化:公司使用 NLU 为智能支持代理提供动力。平台,如 IBM Watson 自然语言理解 等平台可以分析收到的支持单据,根据意图将其转给正确的部门,甚至根据问题描述建议应对措施。 甚至根据问题描述提出建议。
  2. 语义搜索:与匹配精确词的关键词搜索不同,NLU 驱动的搜索引擎 能理解查询的含义。这样,用户在提出 "谁是Ultralytics 的 CEO?"这样的问题时,就能得到直接的答案,而不是Ultralytics"CEO "一词的链接列表。 之类的问题,并得到直接的答案,而不是包含 "CEO "一词的链接列表。
  3. 声控:设备依靠 NLU 来解析口语命令。当用户说 关闭客厅的灯 "时,系统会使用 NLU 来识别动作("关闭")和目标 实体("客厅灯")。

NLU vs. NLP vs. 计算机视觉

将北大西洋公约组织(NLU)与相关的人工智能学科区分开来是很有帮助的:

  • 自然语言处理(NLP) NLP 是一个涵盖所有语言任务的总体领域。NLU 特别是 理解子集(Input $\to$ Meaning)。另一个子集,即自然语言生成(NLG),负责处理 文本的创建(从意义到输出)。
  • 计算机视觉(CV)计算机视觉 NLU 处理文本,而 CV 则解释视觉数据。然而,现代 多模态模型结合了 两者。例如,YOLO等模型使用 NLU 来解释文本提示(如 "蓝色背包"),然后使用 CV 在图像中找到这些物体。 解释文本提示(如 "蓝色背包"),然后使用 CV 在图像中找到这些物体。

视觉人工智能中的 NLU:开放词汇检测

将 NLU 与计算机视觉相结合,可实现 "开放词汇对象检测"。而不是局限于 而不是局限于一个固定的类别列表(如COCO 中的 80 个类别),模型可以根据描述性文本来detect 物体。该 Ultralytics YOLOWorld 该模型通过使用板载文本编码器来 "理解 "你要查找的类,从而体现了这一点。 您要查找的类别。

下面的示例演示了 NLU 如何使视觉模型能够detect 纯文本定义的自定义对象:

from ultralytics import YOLOWorld

# Load a YOLO-World model (incorporates NLU for text-based class definition)
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using natural language
# The model's NLU component understands these terms without retraining
model.set_classes(["person reading a book", "red coffee mug"])

# Run inference on an image
results = model.predict("library.jpg")

# Display results
results[0].show()

工具和未来趋势

在斯坦福大学 NLP 小组和美国国家语言学会(NLU)等机构的研究推动下,NLU 领域发展迅速。 斯坦福 NLP 小组和 计算语言学协会(ACL)等团体的研究推动下,NLU 领域发展迅速。技术正在 从简单的关键词匹配到深入的上下文理解。

对于开发人员来说,即将推出的Ultralytics 平台(2026 年推出)将简化Ultralytics 模型的生命周期。 对于开发人员来说,即将推出的 Ultralytics 平台(2026 年推出)将简化人工智能模型的生命周期,使管理数据集和部署复杂的多模态系统变得更加容易,从而同时利用视觉和 语言理解能力。目前最先进的视觉任务可通过以下方式处理 YOLO11而下一代 YOLO26 的研发工作仍在继续,目标是将速度和准确性更紧密地结合在一起。云服务 Google 自然语言等云服务也提供了强大的应用程序接口(API 为应用程序添加纯粹的 NLU 功能。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入