敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024

Anthropic 的 Claude 4 功能:新增功能和改进

Abirami Vina

5 分钟阅读

2025年6月3日

探索 Anthropic 的 Claude 4 功能,包括推理能力、上下文窗口大小的更新以及整体性能的改进。

诸如计划旅行、调试代码、分析图表或总结 法律 文件之类的任务通常需要使用不同的工具或具备领域专业知识。 如今,得益于最近的人工智能进步,单个 大型语言模型 (LLM) 就可以协助完成所有这些任务。

LLM 是一种经过训练以理解和生成人类语言的 AI 模型。 它通过分析大量文本(书籍、网站、对话等)来学习,以识别与人们书写和说话方式相关的模式。 经过训练后,LLM 可以回答问题、编写代码、总结文档以及执行许多其他基于语言的任务,而且通常只需很少的指导。

Anthropic 是构建这些类型模型的公司之一。 Anthropic 由一群前 OpenAI 员工于 2021 年创立,专注于创建安全、可靠且易于使用的人工智能系统。 他们的最新版本是 Claude 4 模型系列,其中包括两个版本:Claude Opus 4 和 Claude Sonnet 4。

Claude Opus 4 于 2025 年 5 月 22 日发布,专为需要深度推理和持续关注的更复杂任务而构建,例如处理大型代码库或进行深入研究。 在一项测试中,它甚至能够通过创建和引用自己的记忆文件来玩《宝可梦 红》,并在游戏中生成导航指南以帮助它保持在正确的轨道上。

__wf_reserved_inherit
图 1. Claude 4 玩《宝可梦》的示例。

Claude Sonnet 4 虽然不如 Opus 强大,但速度更快、效率更高,使其成为编写、总结和一般问题解决等日常任务的可靠选择。 在本文中,我们将了解 Claude 4 的主要功能以及它正在产生的影响。 让我们开始吧!

大型语言模型 (LLM) 概述

在我们深入了解 Claude 4 及其功能之前,让我们先了解一下大型语言模型在现实世界中的应用。

大多数前沿的 LLM 都建立在一种名为 transformer 的机器学习架构之上,该架构帮助它们理解跨越长篇文章的单词之间的关系。 这使得它们能够做的不只是自动完成句子——它们可以总结文档、编写代码、回答问题和翻译语言。

事实上,LLM 的一个关键优势是它们的灵活性。 经过训练后,它们可以用于执行各种任务,而无需额外的调整。 这使得它们在从客户支持和教育到软件开发、内容创建和研究等应用中都非常有用。

__wf_reserved_inherit
图 2. 大型语言模型用例。

随着 AI 采用率的提高,LLM 正在帮助客户服务团队自动回复,支持学生使用辅导工具,协助开发人员在 VS Code 等编码环境中工作,并让专业人士轻松筛选合同、报告和数据。 同时,一些 LLM 正在被集成到可以执行多步骤任务(如规划、研究或编写工作流程)的 AI 代理 中。

Claude LLM 的演变

Anthropic 的 Claude 模型在速度、推理和整体能力方面随着每个版本的发布而稳步提高。 以下是 Claude 系列在 Claude 4 之前的演变过程的快速概述:

  • Claude Instant 1.2、2 和 2.1:这些早期模型旨在实现经济高效的快速响应。 Claude 2.1 引入了对 200,000 个 token 上下文的支持(这意味着它可以在单个交互中处理长输入,例如完整的转录)。
  • Claude 3 Haiku 和 3.5 Haiku:它们是为速度和效率而优化的轻量级模型。 它们非常适合实时应用程序,如摘要、基本聊天和客户支持。
  • Claude 3 Sonnet 和 3.5 Sonnet:两者都是平衡的模型,可在不牺牲速度的情况下提供强大的性能。 这些模型支持大型提示和长输出,非常适合各种业务用例。
  • Claude 3 Opus:它是一种高性能模型,专为复杂的、需要大量推理的任务而设计。 虽然速度较慢且资源密集,但 Opus 提供了详细、准确的响应,使其非常适合研究、战略和创意工作。
  • Claude 3.7 Sonnet:它是 Claude 4 发布之前最先进的 Claude 模型。 它引入了扩展的思维模式以获得更深入的响应,提高了较长任务的一致性,并且非常适合高级编程、详细分析和长篇写作。

了解 Anthropic 的 Claude 4

Claude 4 改变了大型语言模型处理复杂、长期任务的方式。Anthropic 最新的模型 Claude Opus 4 和 Claude Sonnet 4 并非仅仅关注速度或输出质量,而是旨在支持持续推理、改进上下文处理和更可靠的性能。 

例如,Claude 4 模型会更仔细地思考,避免使用捷径或技巧来完成任务。事实上,与 Sonnet 3.7 等早期版本相比,它们这样做的可能性降低了 65%

这两个模型的另一个关键特性是扩展思维,这使它们能够在响应之前暂停并考虑多个步骤。这使得 Claude 4 在需要周密、逐步推理的情况下特别有用,例如处理分支任务、规划多阶段流程或编写结构化内容。

此外,Claude Opus 4 还引入了改进的记忆能力。当开发者提供对本地文件的访问权限时,该模型可以创建和引用持久性记忆文件,以跟踪跨会话的关键细节。 

这两个模型还被构建为可与外部工具配合使用。Claude 4 可以使用称为 模型上下文协议 (MCP) 的概念连接到 API 和文件系统。这使开发者能够创建 AI 系统,这些系统可以生成响应、与真实世界的数据交互、运行后台任务或使用自定义工具作为工作流程的一部分。

Claude 4 AI 模型的应用

诸如 Agentic AI 和模型上下文协议之类的概念对于 Claude 4 的使用方式至关重要。这些模型不仅仅是为了响应提示而构建的,它们还旨在承担更多参与的任务、连接工具并作为更大系统的一部分运行。

接下来,让我们探讨 Claude 4 如何用于编码和图像分析等应用。

Claude Opus 4 的编码能力一览

编写干净、可靠的代码有时可能具有挑战性,即使对于经验丰富的开发人员也是如此。这就是结对编程(一个人编写代码,另一个人审查代码)多年来一直是一种值得信赖的方法的原因。借助像 Claude Opus 4 这样的 AI 模型,开发人员现在可以从智能助手那里获得类似的支持。

Claude Opus 4 旨在处理复杂的编码项目。它在 SWE-bench 等基准测试中得分很高,该基准测试检查 AI 模型修复开源代码中实际错误的能力,以及 Terminal-bench,该基准测试测试它在命令行环境中处理任务的能力。有趣的是,Claude Opus 4 已经通过 Claude Code 在 VS Code 等工具中使用,它可以帮助完成编写新函数、建议编辑或修复错误等任务。

__wf_reserved_inherit
图 3. VS Code 上的 Claude Code 界面。

Claude 4 的视觉能力

Claude 4 不仅擅长处理文本和代码,还可以分析图像。在早期模型的基础上,它现在具有更强大的视觉能力,使其能够分析和解释图像以及书面内容。它还支持一次处理多个图像,这对于比较设计、阅读图表、总结图表或审查用户界面模型等任务非常有用。 

虽然 Claude 擅长解释视觉效果,但它确实有局限性:它无法识别人,可能难以处理像棋盘或时钟这样的精确布局,并且并非设计用于医疗诊断。对于任何关键用例,最好仔细检查其输出。

如果使用得当,Claude 4 的图像功能可以支持开发人员调试可视化界面、教育工作者创建学习材料以及研究人员审查视觉数据,使其成为结合文本和图像的多模式任务的有效工具。

如何试用 Anthropic Claude 4 的功能

以下是试用 Claude 4 的几种方法:

  • Claude.ai:您可以直接在 Anthropic 的网站上使用 Claude。Sonnet 4 可通过基本帐户使用,而 Opus 4 需要通过 Pro 级别访问。
  • Anthropic API:开发人员可以使用 API 将 Claude 集成到他们自己的工具或服务中。Sonnet 和 Opus 这两种模型都受支持,并且设置需要 API 密钥。
  • GitHub Copilot:Claude 4 在 GitHub Copilot Chat 中可用。Sonnet 4 适用于付费用户,而对 Opus 4 的访问权限取决于您的具体计划。这些模型可以在 GitHub 的网站、VS Code 和移动应用程序中使用。
__wf_reserved_inherit
图 4. Github Copilot 上的 Claude 4 模型。

Claude 4 也可在 Amazon Bedrock 和 Google Cloud 的 Vertex AI 等平台上使用。

这些集成使在云应用程序和企业工具中使用该模型变得更加容易。

主要要点

Claude 4 是 AI 模型发展至今的一个杰出典范。它具备更强的推理能力、更大的记忆容量,以及处理文本和图像的能力,专为更复杂的实际工作而打造。 

无论您是在编写代码、分析数据还是构建 AI 驱动的工具,Claude 4 都能为您提供支持。随着 LLM 的不断改进,像 Claude 这样的工具可能会在日常工作流程中变得更加普遍。

在我们的 GitHub 仓库上了解更多关于 AI 的信息,并加入我们不断壮大的社区。探索零售业 AI农业计算机视觉的最新进展。查看我们的许可选项,让您的视觉 AI 项目成为现实。

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始
链接已复制到剪贴板