Explore [Natural Language Understanding (NLU)](https://www.ultralytics.com/glossary/natural-language-understanding-nlu) to learn how machines interpret human intent. Discover NLU applications in [YOLO26](https://docs.ultralytics.com/models/yolo26/) and the [Ultralytics Platform](https://platform.ultralytics.com).
自然语言理解(NLU)是人工智能(AI)的一个专业分支,专注于机器对人类语言的阅读理解与解读。虽然更广泛的技术能让计算机处理文本数据,但NLU能使系统具体把握词语背后的含义、意图和情感,驾驭语法、俚语和语境的复杂性。通过运用先进的 深度学习(DL)架构,NLU将非结构化文本转化为结构化、可被机器识别的逻辑体系,成为人类沟通与计算行动之间的桥梁。
为理解语言,自然语言理解算法将文本分解为组成部分并分析它们之间的关系。该过程涉及若干关键语言学概念:
在计算机科学领域中,必须将自然语言理解(NLU)与以下密切相关的领域区分开来:
自然语言理解技术为众多智能系统提供支持,这些系统是企业与消费者日常依赖的重要工具。
以下示例展示了如何将自然语言理解(NLU)概念整合到计算机视觉工作流中,使用...
ultralytics 包。在此,我们采用一种结合文本编码器(NLU)与视觉骨干网络的模型,
detect 仅由自然语言描述定义的detect 。
from ultralytics import YOLOWorld
# Load a model capable of vision-language understanding
# This model uses NLU to interpret text prompts
model = YOLOWorld("yolov8s-world.pt")
# Define custom classes using natural language descriptions
# The NLU component parses "person in red shirt" to guide detection
model.set_classes(["person in red shirt", "blue bus"])
# Run inference on an image
results = model.predict("city_street.jpg")
# Display the results
results[0].show()
自然语言理解(NLU)的发展依赖于强大的框架。诸如PyTorch之类的库 PyTorch 提供了构建深度学习模型所需的tensor 功能,而spaCy则为语言处理提供了工业级别的强大工具。
展望未来,行业正朝着统一的多模态系统方向发展。Ultralytics 简化了这一演进过程,提供了一个全面的环境来管理数据集、标注图像并训练可部署到边缘的模型。 大型语言模型(LLMs)负责处理复杂推理,而将其与YOLO26等高速视觉模型集成,则能催生出具备实时感知、理解和交互能力的强大智能体。这种协同效应标志着机器学习(ML)应用的全新前沿。