视觉 AI

探索 Grok 3 的最新功能：xAI 的聊天机器人

了解 LLM（大语言模型）Grok 3、其专用模式和基准测试。了解它如何与领先模型竞争，并学习如何使用它。

ABAbirami Vina

5 min readMarch 10, 2025

Grok 3 发布于 2025 年 2 月 17 日，是由 Elon Musk 创立的公司 xAI 开发的一种 LLM（大语言模型）。此前，我们曾关注过 Grok 2.0 的发布及其 FLUX.1 集成。在这一基础上，Grok 3 带来了更强的推理能力、更快的响应速度以及对实时信息的访问能力。与之前的版本类似，Grok 3 也与 X（前身为 Twitter）进行了整合。

在 Grok 3 发布期间，xAI 首席执行官 Elon Musk 及其团队解释了开发 Grok 的初衷。他们强调，Grok 3 和 xAI 的使命是通过不懈的好奇心去发掘宇宙的真相，即使这意味着真相有时会与所谓的“政治正确”相抵触。

Elon 还详细阐述了该模型名称的含义，他说：“Grok 是海因莱因小说《异乡异客》（Stranger in a Strange Land）中的一个词。它由一个在火星长大的人使用，而 Grok 这个词的意思是全面且深刻地理解某件事。”

Grok 3 发布会

图 1. Grok 3 的发布。

在本文中，我们将探索 Grok 3 的功能、性能基准及其多种 AI 模式。让我们开始吧！

Link to this sectionGrok 3 的演进#

在详细了解 Grok 3 之前，让我们先回顾一下 Grok 的演进历程。以下是通往 Grok 3 的关键里程碑简览：

Grok 0：这是 xAI 的第一个研究原型，使用了 330 亿个参数——即可调节权重，使模型能够捕捉复杂的语言模式。
Grok 1：Grok 的第一个公开版本于 2023 年 11 月发布。它能够参与热门话题的讨论，但推理能力有限。
Grok 1.5：该版本于 2024 年 3 月推出，提供了更好的记忆力和逻辑推理能力。虽然有所改进，但在实时更新和复杂问题解决方面仍显吃力。
Grok 2：它于 2024 年 8 月首次亮相，性能更强、推理更先进，并集成了实时数据。尽管有所进步，但在小众话题上仍会出现幻觉（即貌似合理但不准确的回答）。

Link to this sectionGrok 3 开发背后的技术#

随着每个版本的改进，Grok 的开发需要更强大的基础设施来支持其高级功能和实时学习。早期的迭代在速度和适应性上存在局限，因此 xAI 采用了更强大的系统来满足该 AI 模型日益增长的需求。

此次升级的核心是 xAI 设计的超级计算机 Colossus。Colossus 仅在 122 天内建成。xAI 安装了 100,000 个 NVIDIA H100 GPU（图形处理单元），创建了最大的 AI 数据中心之一。随后在 92 天内，GPU 的数量翻了一番。这使得 Grok 3 能够处理更多数据，学习速度更快，并随着人们的交互不断进步。

Grok 3 由 Colossus 超级计算机驱动

图 2. Grok 3 由 Colossus 驱动。

此外，为了保持速度和效率，Grok 3 使用了一种称为大规模测试时计算（TTCS）的技术。它根据问题的复杂程度调整计算能力——简单问题消耗较少的功率，而复杂问题则会分配额外的资源。这使得该模型能够在高效利用资源的同时，提供快速且准确的响应。

Link to this sectionGrok 3 AI 模型的专业版本#

Grok 3 的关键特征之一是它提供可用于不同任务的专业版本。让我们探讨每个版本如何增强性能并提升用户体验。

Link to this sectionGrok 3 Mini：专为快速且简单的任务而设计#

随着生成式 AI 成为日常生活的一部分，你可能遇到过响应过慢的聊天机器人。Grok 3 Mini 是 Grok 3 的精简版本，旨在通过降低计算需求来提供快速回复，从而解决这一问题。

它仍然保留了 Grok 3 的核心功能，使其适用于需要实时对话中平稳、高性价比性能的应用场景。例如，客户支持聊天机器人和交互式虚拟助手可以使用 Grok 3 Mini。

Link to this sectionGrok 3 Think：为复杂问题解决而构建#

虽然 Grok 3 Mini 专注于速度，但 Grok 3 Think 是为高级推理和深度分析而构建的。通过大规模强化学习训练，Grok 3 Think 通过仔细分析查询、通过回溯纠正错误以及探索多种方法来解决复杂问题。

例如，在解决多步骤数学问题时，Grok 3 Think 会将其分解为逻辑步骤。其独特的 Think 模式甚至允许用户检查其最终答案背后的思维链。这种模式适用于数学证明、编码挑战和基于逻辑的问题等任务。

Link to this sectionGrok 3 多种模式概述#

除了 Think 模式外，Grok 3 还配备了几种专为不同任务设计的模式。接下来，让我们看看这些 Grok 3 模式并探索它们提供的附加功能。

Link to this section用于高级 AI 推理的 Grok 3 Big Brain 模式#

Grok 3 的 Big Brain 模式可用于需要深度分析和结构化问题解决的任务。它通过使用额外的计算能力以更高的准确性应对复杂挑战，超越了标准处理方式。

特别是，该模式将详细推理置于速度之上。它需要更多时间生成响应，但提供结构严谨的见解，这对研究、编码和多步骤 AI 任务很有帮助。研究人员和开发人员可以在准确性优先的任务中使用此模式。

Link to this section用于获得深度研究见解的 Grok 3 DeepSearch 模式#

Grok 3 的 DeepSearch 模式通过在响应前检索实时数据并验证来源，帮助模型保持最新状态。与许多仅依赖可能迅速过时的存储知识的 AI 模型不同，DeepSearch 从网络获取最新信息。这确保了即使事实和事件迅速演变，回答依然准确。

无论你是在关注突发新闻、跟踪市场趋势还是验证新的科学发现，DeepSearch 都是获取最新见解的一种快速、可靠的方式。

通过弥合静态训练数据与不断变化的现实世界事件之间的鸿沟，DeepSearch 增强了 Grok 3 响应的准确性和相关性。

预览 Grok 3 的 DeepSearch 模式

图 3. Grok 3 的 DeepSearch 模式概览。

Link to this sectionGrok 3 性能基准概述#

在基准测试方面，Grok 3 在多项任务中表现出色。在推理方面，它在 2025 年美国数学邀请赛 (AIME) 中获得了 93.3% 的分数，展现了其解决复杂数学问题的强大能力。它还在研究生水平的专家推理任务 (GPQA) 中达到 84.6%，在 LiveCodeBench 评估的编码挑战中达到 79.4%，证明了其在处理多步骤问题解决和代码生成方面的技能。

即便是其精简版 Grok 3 Mini 也表现惊人，在 AIME 2024 中获得 95.8%，在 LiveCodeBench 中获得 80.4%，这表明它兼顾了效率与高性能。

Grok 3 与领先 AI 模型的基准测试结果对比

图 4. Grok 3 在关键基准测试中表现优于领先的 AI 模型。

Link to this sectionGrok 3 与 ChatGPT 的对比#

你可能想知道，Grok 3 与其最大的竞争对手 ChatGPT 相比如何？OpenAI 的 ChatGPT 多年来一直是 AI 领域知名品牌，并在每个新版本中不断改进。

与此同时，Grok 于 2023 年晚些时候进入市场，起步较晚。早期版本在推理方面表现吃力，特别是在与 GPT-4 相比时。

然而，xAI 凭借 Grok 1.5 和 Grok 2 迎头赶上。现在，随着 Grok 3 的发布，他们取得了重大进步。事实上，在与竞争对手的基准测试中，Grok 3 一贯表现出先进的推理和问题解决能力，使其在需要深入分析和复杂思考的任务中脱颖而出。

Grok 3 与 ChatGPT 的对比

图 5. Grok 3 与 ChatGPT 的对比。

Link to this section理解围绕 Grok 3 的辩论#

随着 Grok 的发展，人们对内容审核和信息准确性提出了一些担忧。例如，其面向高级订阅用户的新语音交互模式提供了多种角色，包括使用强硬语言和坦率语气的“狂放（unhinged）”设置。

虽然这种模式反映了 xAI 希望提供更无拘无束的对话体验的目标，但也引发了关于建立指导方针和减轻错误信息传播的重要讨论。

同样，由于 Grok 3 可以利用来自 X 的实时数据，它可能会产生未经核实或带有偏见的信息。与依赖静态数据的模型不同，持续更新使审核变得更具挑战性。这些讨论凸显了在发展负责任的 AI 方面面临的持续挑战。

Link to this section如何使用 Grok 3 AI#

尽管存在这些担忧，Grok 3 仍被广泛使用。如果你有兴趣尝试，可以通过以下方式访问其功能：

聊天界面： 用户可以通过其聊天界面与 Grok 3 进行交互，用于回答问题、生成内容和编码辅助等任务。
移动应用： Grok 3 可通过其专用应用程序在 iOS 和 Android 平台上访问。
高级套餐： Grok 3 通过高级套餐提供高级功能。
API： 开发人员目前可以访问 Grok 2 API。Grok 3 的 API 尚未发布，但 xAI 已表示很快就会推出。

Link to this section关键要点#

Grok 3 是一款具有实时学习功能和专用模式的 LLM。它通过提取实时数据以获得更准确的答案，在研究、编码和解决问题等领域脱颖而出。

虽然内容审核仍是围绕它的辩论主题，但其改进和适应的能力使其成为了 AI 聊天机器人领域的有力竞争者。随着每一次更新，我们都在见证 Grok 变得更加先进。

加入我们的社区，并在我们的 GitHub 仓库探索最新的 AI 进展。通过我们的解决方案页面了解自动驾驶汽车中的 AI 和医疗保健中的计算机视觉。查看我们的许可方案，立即开始你的 AI 之旅！

探索 Grok 3 的最新功能：xAI 的聊天机器人

Link to this sectionGrok 3 的演进#

Link to this sectionGrok 3 开发背后的技术#

Link to this sectionGrok 3 AI 模型的专业版本#

Link to this sectionGrok 3 Mini：专为快速且简单的任务而设计#

Link to this sectionGrok 3 Think：为复杂问题解决而构建#

Link to this sectionGrok 3 多种模式概述#

Link to this section用于高级 AI 推理的 Grok 3 Big Brain 模式#

Link to this section用于获得深度研究见解的 Grok 3 DeepSearch 模式#

Link to this sectionGrok 3 性能基准概述#

Link to this sectionGrok 3 与 ChatGPT 的对比#

Link to this section理解围绕 Grok 3 的辩论#

Link to this section如何使用 Grok 3 AI#

Link to this section关键要点#

Explore solutions

机器人技术中的 AI

物流中的 AI

零售业 AI

医疗保健中的 AI

制造业中的 AI

汽车中的 AI

农业中的 AI

机器人技术中的 AI

物流中的 AI

零售业 AI

医疗保健中的 AI

制造业中的 AI

汽车中的 AI

农业中的 AI

机器人技术中的 AI

物流中的 AI

零售业 AI

医疗保健中的 AI

制造业中的 AI

汽车中的 AI

农业中的 AI

让我们一起构建 AI 的未来！