术语表

机器翻译

了解机器翻译如何利用人工智能和深度学习打破语言障碍,实现全球无缝沟通和无障碍访问。

机器翻译(MT)是计算语言学和人工智能(AI)的一个分支领域,主要研究如何将文本或语音从一种语言自动翻译成另一种语言。作为自然语言处理(NLP)的核心任务,机器翻译系统分析源文本以理解其含义,然后生成目标语言的等效文本,并保留上下文和流畅性。早期的 MT 系统依赖于基于规则和统计的人工智能方法,而现代 MT 则以复杂的深度学习模型为主导,能够提供更准确、更自然的翻译。

机器翻译如何工作

现代机器翻译系统采用先进的神经网络 (NN),通过分析大量文本数据来学习翻译。该领域最重大的突破是Transformer架构的开发。谷歌研究人员在 2017 年发表的一篇题为"Attention Is All You Need "的里程碑式论文中介绍了这一模型架构,它彻底改变了 MT。

Transformer 模型使用注意力机制一次性处理整个输入序列,而不是逐个处理单词。这使得该模型在生成翻译的每个单词时,都能权衡源句中不同单词的重要性,从而更有效地捕捉长距离依赖关系和复杂语法结构。这一过程从标记化开始,将输入文本分解成更小的单位(标记),然后将其转换成模型可以处理的称为嵌入的数字表示。这些模型是在海量并行语料库(包含多种语言的相同文本的大型数据集)上训练出来的。

实际应用

机器翻译为促进全球通信和信息获取的众多应用提供了动力:

  • 即时通信: 谷歌翻译DeepL Translator等服务允许用户实时翻译网页、文档和信息,从而打破世界各地的语言障碍。这些工具通常集成到浏览器和Skype Translator等通信应用程序中,以提供无缝体验。
  • 内容本地化:企业使用 MT 翻译产品说明、用户手册和营销活动,以打入国际市场。这对零售和电子商务领域的人工智能至关重要。通常情况下,MT 用于第一道工序,然后由人工译员在称为 "编辑后机器翻译"(PEMT)的流程中进行完善。
  • 多语言客户支持:公司将 MT 整合到聊天机器人和客户服务平台中,使其能够提供多语种支持,而无需庞大的多语种代理团队。这将改善客户体验,提高运营效率。
  • 信息获取:研究人员、记者和公众可以获取因语言障碍而无法获取的信息。例如,路透社等新闻机构利用 MT更快地向全球受众发布新闻。

区分 MT 与相关概念

必须将机器翻译与其他相关的人工智能概念区分开来:

  • 自然语言处理(NLP):NLP 是人工智能的一个广泛领域,涉及计算机与人类语言之间的交互。MT 是 NLP 中的一项特定任务,还有情感分析文本摘要等其他任务
  • 语言建模:训练语言模型是为了预测序列中的下一个单词。虽然这是现代 MT 系统的核心组成部分,但 MT 的目标不仅仅是预测,而是用不同的语言生成连贯且上下文准确的翻译。大型语言模型 (LLM)是一种功能强大的语言模型,可以执行 MT 和许多其他任务。
  • 计算机视觉(CV):MT 处理文本,而计算机视觉侧重于解释图像和视频中的视觉信息。这两个领域正在向多模态模型靠拢,例如,多模态模型可以翻译图像中的文字。这些模型,如YOLO-World,可以理解视觉和语言环境。

尽管取得了重大进展,但 MT 仍面临挑战,包括处理细微差别、成语、文化背景和减少算法偏差。未来的 MT 正朝着增强语境意识和与其他人工智能模式整合的方向发展。Ultralytics HUB等平台简化了复杂人工智能模型的训练部署,为未来的进步铺平了道路。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板