Claude 3.7 Sonnet 发布，编程能力全面领先Anthropic 于 2 月 25 日发布了 Claude 3.7 Sonnet，这是全球首个支持双模式推理的人工智能模型

一个小站的自留地

Anthropic 正准备发布思考模型与网页搜索功能，Pro 会员即将可用。据@M1， Claude iOS应用的最新更新已经出现如「Steps」和「Think」等关键词。为 Claude 增加网页搜索功能的计划曾在一月被Anthropic CEO Dario Amodei 确认为是「公司的优先事项」。 —————— 多个媒体预计，Anthropic 计划在二月底或三月初发布新进展，最早的可能时间窗口是 2 月 24 日，但目前官方暂未透露任何信息。

Claude 3.7 Sonnet 发布，编程能力全面领先

Anthropic 于 2 月 25 日发布了 Claude 3.7 Sonnet，这是全球首个支持双模式推理的人工智能模型。该模型提供标准和扩展思考两种模式：标准模式保持快速响应，适合日常对话；扩展思考模式通过自我反思提升复杂任务表现，特别在数学、物理和编程领域效果显著。在各项基准测试中，Claude 3.7 Sonnet 在编码能力上全面超越 OpenAI 的 o1 和 DeepSeek R1，在软件工程基准 SWE-bench 上创下 70.3% 的纪录。

同步推出的 Claude Code 命令行工具支持测试驱动开发、复杂调试与代码重构，官方演示显示它可自动化处理 45 分钟以上人工编程任务。目前所有 Claude 套餐都已可使用新模型，但扩展思考模式仅向付费用户开放。定价保持不变：每百万输入词元 3 美元，输出词元 15 美元。

Claude 3.7 Sonnet 目前立即对所有用户可用，API 同步上线。