遇见 YOLO26: 下一代视觉 AI。
Ultralytics
视觉 AI

从代码到对话:大语言模型(LLM)是如何工作的?

探索大型语言模型 (LLMs) 的工作原理、它们的演变过程,以及它们如何应用于法律和零售等行业。

ABAbirami Vina
4 min read
大语言模型(LLM)的工作原理

大型语言模型 (LLMs) 是先进的生成式 AI 系统,能够理解并生成类人的文本。这些模型经过了从互联网上收集的数百万 GB 文本数据的训练,能够识别和解读人类语言。像 ChatGPT 这样由 LLM 驱动的创新成果已家喻户晓,让生成式 AI 变得更加触手可及。

随着全球 LLM 市场预计到 2034 年达到 856 亿美元,许多组织正致力于在其业务职能中采用 LLM。

在本文中,我们将探讨大型语言模型的工作原理及其在各行各业的应用。让我们开始吧!

使用深度学习算法生成和理解文本的 LLM

图 1. LLMs 使用深度学习算法来生成和理解文本。

Link to this section大型语言模型的演变#

大型语言模型的历史跨越了数十年,充满了研究突破和迷人的发现。在深入探讨核心概念之前,让我们先了解一些最重要的里程碑。

以下是 LLM 发展过程中关键里程碑的快速概览:

  • 20 世纪 60 年代: Joseph Weizenbaum 创建了最早的聊天机器人之一 ELIZA。它使用了模式匹配,即系统检测用户输入中的关键词并做出相应响应的方法,从而模拟基本的对话。

  • 20 世纪 90 年代: 循环神经网络 (RNNs) 被开发出来用于处理文本或语音等序列数据。它们可以记住过去的输入,但在处理长序列时遇到困难,这就促成了长短期记忆 (LSTM) 网络的诞生,以解决这一问题。

  • 2014 年: 门控循环单元 (GRUs) 作为 LSTM 的一种更简单、更快的版本被引入。与此同时,注意力机制得到发展,使 AI 能够专注于序列中最关键的部分,从而实现更好的理解。

  • 2017 年: Transformer 引入了一种利用多头注意力机制和并行处理来处理文本的新方法。与 RNN 不同,它们可以一次分析整个序列,使其速度更快,且在理解上下文方面表现更出色。

自 2018 年以来,诸如 BERT(Transformer 的双向编码器表示)和 GPT(生成式预训练 Transformer)等模型利用 Transformer 引入了双向处理,使信息能够向前和向后流动。这些进步极大地提高了此类模型理解和生成自然语言的能力。

大语言模型的演变

图 2。大型语言模型的演变。

Link to this sectionLLM 是如何工作的?#

要理解 LLM(大型语言模型)的工作原理,首先必须明确 LLM 到底是什么。

LLM 是一种基础模型——即在海量数据集上训练的通用 AI 系统。这些模型可以针对特定任务进行微调,旨在以模仿人类写作的方式处理和生成文本。LLM 擅长通过极少的提示进行预测,并被广泛应用于生成式 AI 中,根据人类输入来创作内容。它们能够推断上下文、提供连贯且相关的响应、进行语言翻译、总结文本回答问题、辅助创意写作,甚至生成或调试代码

LLM 的规模非常庞大,运行在数十亿个参数之上。参数是模型在训练过程中学习的内部权重,使它能够根据接收到的输入生成输出。通常,参数越多的模型往往性能越好。

以下是一些热门 LLM 的示例:

  • GPT-4o:GPT-4o 于 2024 年 5 月发布,是 OpenAI 最新的多模态模型。它可以处理文本、图像、音频和视频输入。
  • Claude 3.5:Anthropic 于 2024 年 6 月推出,Claude 3.5 基于 Claude 3 系列,提供了更强的自然语言处理和问题解决能力。
  • Llama 3:Meta 的 Llama 3 系列于 2024 年 4 月发布,包括参数高达 700 亿的模型。这些开源模型以其高性价比和在各项基准测试中的强劲表现而闻名。
  • Gemini 1.5:Google DeepMind 于 2024 年 2 月推出,Gemini 1.5 是一个能够处理文本、图像及其他数据类型的多模态模型。

Link to this sectionLLM 的关键组成部分#

大型语言模型 (LLMs) 有几个关键组成部分,它们协同工作以理解并响应用户提示。其中一些组件被组织成层。每一层在语言处理流水线中处理特定的任务。

例如,嵌入层将单词分解为更小的部分,并识别它们之间的关系。

在此基础上,前馈层分析这些部分以寻找模式。同样地,循环层确保模型保持单词的正确顺序。

另一个重要的组件是注意力机制。它帮助模型专注于输入中最相关的部分,从而允许它优先处理关键词或短语,而非不重要的内容。以将“The cat sat on the mat”翻译成法语为例:注意力机制确保模型将“cat”与“le chat”对齐,将“mat”与“le tapis”对齐,从而保持句子的原意。这些组件一步步协同工作,以处理并生成文本。

Link to this section不同类型的 LLM#

所有 LLM 都共享相同的基础组件,但它们可以根据特定目的进行构建和定制。以下是不同类型 LLM 及其独特能力的示例:

  • 零样本模型 (Zero-shot models):这些模型可以处理它们未经过专门训练的任务。它们利用已学习的通用知识来理解新的提示,并在无需额外训练的情况下做出预测。
  • 微调模型 (Fine-tuned models):微调模型基于通用模型,但经过了针对特定任务的进一步训练。这种额外的训练使它们在专业应用中非常有效。
  • 多模态模型 (Multimodal models):这些先进模型能够处理并生成多种类型的数据,例如文本和图像。它们专为需要结合文本和视觉理解的任务而设计。

Link to this section自然语言处理与 LLM 的关系#

自然语言处理 (NLP) 帮助机器理解和使用人类语言,而生成式 AI 则专注于创造文本、图像或代码等新内容。大型语言模型 (LLMs) 将这两个领域结合在了一起。它们使用 NLP 技术来理解语言,然后应用生成式 AI 来创建原创的、类人的回答。这种结合让 LLM 既能处理语言,又能生成具有创造性和意义的文本,使其在对话、内容创作和翻译等任务中非常有用。通过融合 NLP 和生成式 AI 的优势,LLM 使机器能够以一种自然且直观的方式进行交流。

生成式 AI、NLP 和 LLM 之间的关系

图 3。生成式 AI、NLP 与 LLM 之间的关系。

Link to this sectionLLM 在各行各业的应用#

既然我们已经了解了 LLM 是什么以及它是如何工作的,让我们来看看一些展示 LLM 潜力的不同行业的用例。

Link to this section在法律科技中使用 LLM#

AI 模型正在改变法律行业,而 LLM 使律师研究和起草法律文件的任务变得高效得多。它们可用于快速分析法律文本(如法律和既往案例),以找到律师所需的信息。LLM 还可以协助撰写合同或遗嘱等法律文件。

有趣的是,LLM 不仅在研究和起草方面有用,它们还是确保法律合规和简化工作流程的宝贵工具。组织可以使用 LLM 通过识别潜在违规行为并提供解决方案建议来遵守法规。在审查合同时,LLM 可以高亮显示关键细节、识别风险或错误,并建议修改内容。

LLM 如何用于法律研究的概述

图 4. LLM 如何用于法律研究的概述。

Link to this section零售与电子商务:由 LLM 驱动的 AI 聊天机器人#

LLM 可以分析客户数据,如过往购买记录、浏览习惯和社交媒体活动,以发现模式和趋势。这有助于为产品创建个性化的推荐。集成了 LLM 的应用程序可以指导客户完成产品购买,例如帮助他们挑选商品、添加到购物车并完成结账。

此外,基于 LLM 的聊天机器人可以回答有关产品、服务和运输的常见客户咨询。这使客户服务代表能够腾出时间处理更复杂的问题。亚马逊最新的 AI 聊天机器人 Rufus 就是一个很好的例子。它利用 LLM 生成产品评价的摘要。Rufus 还可以检测虚假评论并为客户推荐服装尺码选项。

Link to this section研究与学术领域的 LLM#

LLM 的另一个有趣应用是在教育领域。LLM 可以为学生生成练习题和测验,使学习更具互动性。

当利用学校教材进行微调时,LLM 可以提供个性化学习体验,允许学生按自己的节奏学习并专注于他们认为困难的课题。教师也可以利用 LLM 来批改学生作业,如论文和考试,从而节省时间并专注于教学的其他方面。

此外,这些模型可以将教科书和学习材料翻译成不同语言,帮助学生获取母语的教育内容。

使用 LLM 翻译文本的示例

图 5. 使用 LLM 进行文本翻译的示例。

Link to this section大型语言模型的优缺点#

LLM 通过理解自然语言、自动化摘要和翻译等任务以及辅助编程提供了许多好处。它们能够整合来自不同来源的信息、解决复杂问题并支持多语言交流,这使它们在许多行业中都很有用。

然而,它们也伴随着挑战,例如传播错误信息的风险、关于创建逼真但虚假内容的伦理担忧,以及在关键领域偶尔出现的不准确性。最重要的是,它们具有显著的环境影响,因为训练单个模型产生的碳排放可能相当于五辆汽车的一生排放量。平衡它们的优势与这些局限性是负责任地使用它们的关键。

Link to this section关键要点#

大型语言模型通过让机器更容易理解和创建类人文本,正在重塑我们使用生成式 AI 的方式。它们正在帮助法律、零售和教育等行业提高效率,无论是起草文件、推荐产品还是创建个性化学习体验。

虽然 LLM 提供了许多好处,如节省时间和简化任务,但它们也带来了准确性问题、伦理担忧和环境影响等挑战。随着这些模型的不断改进,它们必将在我们的日常生活和工作中发挥更大的作用。

要了解更多信息,请访问我们的 GitHub 存储库,并与我们的社区互动。在我们的解决方案页面上探索 AI 在自动驾驶汽车农业中的应用。🚀

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅