遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Natural Language Processing (NLP)

通过 Ultralytics 探索自然语言处理 (NLP)。学习 NLP 如何驱动聊天机器人、情感分析以及通过 Ultralytics YOLO26 实现的开放词汇检测。

自然语言处理 (NLP) 是 人工智能 (AI) 的一个动态分支,专注于计算机与人类语言之间的交互。与依赖精确、结构化输入的传统编程不同,NLP 使机器能够以一种既有价值又有意义的方式理解、解释和生成人类语言。通过将计算语言学与统计学、机器学习和 深度学习 (DL) 模型相结合,NLP 允许系统处理文本和语音数据,旨在提取含义、情感和上下文。

Link to this section核心机制#

从本质上讲,NLP 涉及将原始文本转换为计算机可以处理的数字格式,这一步骤通常通过 分词 (tokenization) 和创建 词嵌入 (embeddings) 来实现。现代系统利用 Transformer 架构,该架构采用 自注意力 (self-attention) 机制来权衡句子中不同单词彼此之间的重要性。这使得模型能够处理长距离依赖关系以及讽刺或习语等细微差别,而这些对于早期的 循环神经网络 (RNN) 来说是难以处理的。

Link to this section实际应用#

NLP 技术在现代软件中无处不在,为企业和个人每天用于简化运营和增强用户体验的工具提供支持。

  • 客户服务自动化: 许多公司使用 聊天机器人 (chatbots) 和自动化代理来处理客户咨询。这些系统使用 情感分析 (Sentiment Analysis) 来确定消息背后的情感基调——识别客户是满意、沮丧还是在提问——从而实现优先响应。像 Google Cloud Natural Language API 这样的工具为开发人员提供了预训练模型,以快速实现这些功能。
  • Vision-Language Integration: In the field of Computer Vision (CV), NLP allows for "open-vocabulary" detection. Instead of training a model on a fixed list of classes (like the 80 classes in the COCO dataset), models like YOLO-World use text encoders to identify objects based on natural language descriptions. This bridge allows users to find specific items, such as "person wearing a red helmet," without retraining the model.
  • 语言翻译:Google Translate 这样的服务利用 机器翻译 (Machine Translation) 即时将文本从一种语言转换为另一种语言,打破了全球交流障碍。

Link to this section区分相关术语#

为了理解 NLP 的范围,将其与 数据科学 领域中密切相关的概念区分开来会有所帮助:

  • 自然语言理解 (NLU) 虽然 NLP 是总称,但 NLU 是一个专注于阅读理解的特定子集。NLU 处理确定文本背后的 意图含义,并处理歧义和上下文。
  • 大型语言模型 (LLMs) LLMs(例如 GPT 系列或 Llama)是在 PB 级数据上训练的大型深度学习模型。它们是用于执行高级 NLP 任务的 工具,能够进行复杂的 文本生成 (Text Generation) 和推理。
  • 光学字符识别 (OCR) OCR 严格来说是将文本图像(扫描文档)转换为机器编码文本的过程。NLP 在 OCR 将内容数字化以理解所写内容 之后 接管工作。

Link to this section代码示例:连接文本与视觉#

以下示例演示了 NLP 概念如何与计算机视觉交互。我们使用 ultralytics 包加载一个能够理解文本提示的模型。通过用自然语言定义自定义类,我们利用模型的内部词汇表(嵌入)来检测图像中的对象。

from ultralytics import YOLOWorld

# Load a model with vision-language capabilities
model = YOLOWorld("yolov8s-world.pt")

# Define NLP-based search terms (classes) for the model to find
# The model uses internal text embeddings to understand these descriptions
model.set_classes(["blue bus", "pedestrian crossing", "traffic light"])

# Run inference to detect objects matching the text descriptions
results = model.predict("city_scene.jpg")

# Show the results
results[0].show()

Link to this section工具与未来方向#

开发 NLP 应用程序通常需要强大的库。研究人员经常使用 PyTorch 来构建自定义神经网络架构,而 自然语言工具包 (NLTK) 仍然是教育预处理任务的主要工具。对于生产级文本处理,spaCy 因其高效而被广泛采用。

随着 AI 的发展,模态的融合是一个关键趋势。平台正朝着统一的工作流发展,其中视觉和语言被视为互联的数据流。Ultralytics Platform 简化了这一生命周期,提供管理 数据集、注释图像和训练最先进模型的工具。当 NLP 处理语言方面时,像 YOLO26 这样的高性能视觉模型确保以实时边缘应用所需的速度和精度处理视觉数据,为 多模态 AI (Multimodal AI) 系统创造无缝体验。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅