
Anthropic 发布了其最新的 AI 模型 Claude 3.7 Sonnet 。除了标准模式外,该模型还具有 “扩展思维模式”(extended thinking mode),可逐步推理并将其过程展示给用户。 Claude 3.7 Sonnet 现已通过所有 Claude 订阅、 Anthropic API 、 Amazon Bedrock 和 Google Cloud Vertex AI 提供。扩展思维模式不适用于免费版本。与其他大语言模型不同,Anthropic 表示,推理模式并不是一个单独的模型,而是嵌入在 Claude 3.7 Sonnet 中的。 API 用户可以详细控制模型的思考时间,从而决定模型在推理时可以使用多少个 tokens 。在基准测试中,Anthropic 表示 Claude 3.7 Sonnet 在 swe-bench Verified 和 tau-bench 这两个测试框架中表现优于竞争模型,这些框架用于测试 AI 模型在现实软件问题和复杂任务上的能力。
与此同时,Anthropic 还推出了 Claude Code 的有限研究预览版。该工具使开发者能够直接从终端将编程任务委托给 Claude 。除了这些发布,Anthropic 还将 Claude.ai 平台上的 GitHub 集成扩展到所有订阅用户。开发者因此可直接将他们的代码库与 Claude 连接。