探索自然语言理解 (NLU) 及其如何使机器能够解释意图和情感。学习如何将人类语言与视觉 AI 相结合。
自然语言理解 (NLU) 是 人工智能 (AI) 的一个专门子集,专注于机器对人类语言的阅读理解和解释。尽管更广泛的技术允许计算机处理文本数据,NLU 特别使系统能够掌握词语背后的含义、意图和情感,驾驭语法、俚语和上下文的复杂性。通过利用先进的 深度学习 (DL) 架构,NLU 将非结构化文本转换为结构化的、机器可读的逻辑,充当人类交流与计算行动之间的桥梁。
为了理解语言,NLU 算法将文本分解为组成部分并分析它们之间的关系。这个过程涉及几个关键的语言学概念:
区分 NLU 与计算机科学领域内密切相关的其他领域至关重要:
自然语言理解 (NLU) 为企业和消费者日常依赖的许多智能系统提供支持。
以下示例演示了如何将自然语言理解(NLU)概念集成到计算机视觉工作流中,使用
ultralytics 包。我们在此使用一个模型,该模型结合了文本编码器 (NLU) 和视觉骨干网络,以 detect 纯粹由自然语言描述定义的对象。
from ultralytics import YOLOWorld
# Load a model capable of vision-language understanding
# This model uses NLU to interpret text prompts
model = YOLOWorld("yolov8s-world.pt")
# Define custom classes using natural language descriptions
# The NLU component parses "person in red shirt" to guide detection
model.set_classes(["person in red shirt", "blue bus"])
# Run inference on an image
results = model.predict("city_street.jpg")
# Display the results
results[0].show()
自然语言理解 (NLU) 的发展依赖于强大的框架。像 PyTorch 这样的库提供了构建深度学习模型所需的 tensor 运算,而 spaCy 则提供了用于语言处理的工业级工具。
展望未来,行业正朝着统一的多模态系统发展。Ultralytics Platform 简化了这一演进过程,提供了一个全面的环境来管理数据集、标注图像并训练可部署到边缘的模型。虽然大型语言模型(LLMs)处理复杂的推理任务,但将其与YOLO26等高速视觉模型相结合,可以创建出能够实时感知、理解并与世界互动的强大智能体。这种协同作用代表了机器学习(ML)应用的下一个前沿。

开启您的机器学习未来之旅