术语表

自然语言处理(NLP)

探索自然语言处理 (NLP) 的概念、技术和应用,如聊天机器人、情感分析和机器翻译。

自然语言处理(NLP)是人工智能(AI)机器学习(ML)的一个动态领域,致力于使计算机能够以有价值的方式理解、解释、生成人类语言并与之互动。NLP 的最终目标是弥合人类与机器之间的沟通鸿沟,使软件能够以超越人类能力的规模和速度处理和分析文本与语音数据。这就需要开发能够处理自然语言固有的复杂性、细微差别和上下文的算法和模型。

NLP 如何工作?

NLP 系统使用计算语言学--基于规则的人类语言建模--以及统计和深度学习模型来处理语言数据。这一过程通常从数据预处理开始,在预处理过程中,原始文本被分解成较小的、易于管理的单元,这一过程被称为标记化

一旦标记化,现代 NLP 管道就会利用先进的神经网络架构,如递归神经网络 (RNN),以及最近极具影响力的Transformer架构。这些模型是当今大型语言模型(LLM)的基础,它们分析单词之间的上下文关系。这使它们能够执行复杂的任务,如识别意图、翻译语言,甚至创建原创内容。斯坦福大学 NLP 小组等领先机构和计算语言学协会 (ACL) 等组织都处于这项研究的前沿。

实际应用

NLP 为我们许多人日常使用的广泛应用提供了动力。两个突出的例子包括

  1. 机器翻译 谷歌翻译等工具使用复杂的 NLP 模型将文本和语音从一种语言自动翻译成另一种语言。这些系统分析源语言中的句子结构和含义,然后生成语法正确、语境恰当的目标语言译文。这些模型是在联合国议事录等来源的大量平行文本数据集上训练出来的。

  2. 情感分析公司使用 NLP 分析来自社交媒体、产品评论和调查的客户反馈。通过将文本的情感基调分为积极、消极或中性,企业可以深入了解公众舆论、客户满意度和品牌认知,从而做出数据驱动型决策。

其他常见应用包括 Siri 和 Alexa 等智能虚拟助手、垃圾邮件过滤器、文本摘要工具和客户服务聊天机器人

NLP 与相关概念

虽然相关,但 NLP 与一些类似术语有所不同:

  • 自然语言理解(NLU)NLU 是 NLP 的一个子集,专门侧重于理解方面--从语言中提取意义、意图和上下文。NLP 的范围更广,还包括文本生成和语音合成等任务。
  • 文本生成这是 NLP 中的一项特定功能或任务,重点是生成类人文本。虽然它是许多 NLP 应用(如聊天机器人或翻译)的核心部分,但并不涵盖 NLP 的理解或分析方面。
  • 计算机视觉(CV)计算机视觉涉及解释和理解来自图像和视频等视觉输入的信息,重点是物体检测图像分割等任务。而 NLP 则侧重于语言数据。然而,在处理文本和图像的多模态模型中,这两个领域的交集越来越多,使自动图像字幕等应用成为可能。您可以阅读更多有关连接 NLP 和 CV 的信息。Ultralytics 专注于 CV 领域,提供Ultralytics YOLO11等模型,用于要求高精度和高速度的任务。

工具和平台

开发和部署 NLP 应用程序通常需要利用专门的库和平台:

  • 库: spaCyNLTK等开源库为标记化、解析和实体识别等常见 NLP 任务提供了工具。
  • 平台: Hugging Face提供了一个庞大的预训练模型(尤其是 Transformers)、数据集和工具,大大加快了开发速度。为了管理 ML 模型的端到端生命周期,包括在 NLP 或 CV-NLP 组合管道中使用的模型,Ultralytics HUB等平台提供了强大的MLOps功能,可简化训练、部署和监控。查看Ultralytics 文档,了解有关模型开发和部署的更多资源。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板