Anthropic 于 7 月 1 日发布 Claude Sonnet 5,并将其设为 Free 与 Pro 用户的预设模型。API 标准定价为每百万 token 输入 3 美元、输出 15 美元,8 月 31 日前优惠期定价为输入 2 美元、输出 10 美元;对比旗舰 Opus 4.8 标准定价便宜约六成。
Claude Sonnet 5 的 API 定价、优惠期限与 tokenizer 说明
Claude Sonnet 5 的 context window 上限为 100 万 token,最大输出达 128k token。此版本采用更新版 tokenizer,Anthropic 说明相同输入在新 tokenizer 下产生的 token 数量为前代的 1.0 至 1.35 倍,视内容而定。Anthropic 声称定价已调整为「大致成本中性」,并建议高流量用户自行执行基准测试以评估实际账单影响。
Anthropic 公布的 6 项基准测试数据
以下数据均来自 Anthropic 官方,尚未有第三方独立验证报告:
SWE-bench Pro(agentic 代码):Sonnet 5 63.2%,Opus 4.8 69.2%,Sonnet 4.6 58.1%
Terminal-Bench 2.1(终端机操控):Sonnet 5 80.4%,Opus 4.8 82.7%
Humanity’s Last Exam(多学科推理,搭配工具):Sonnet 5 57.4%,Opus 4.8 57.9%
GDPval-AA v2(知识工作):Sonnet 5 得分 1,618;Opus 4.8 得分 1,615
OSWorld-Verified(电脑操控):Sonnet 5 81.2%,Sonnet 4.6 78.5%
Firefox 147 漏洞评估:Sonnet 5 可用漏洞产出率 0%,部分成功率 13.2%;Sonnet 4.6 部分成功率 8.8%;Opus 4.8 为 68.8%
Anthropic 安全报告中 Sonnet 5 的安全指标
Anthropic 的安全报告指出,Claude Sonnet 5 相较 Sonnet 4.6,幻觉(hallucination)与谄媚倾向(sycophancy)更低,拒绝恶意请求的能力更强,且此版本已预设启用网络安全防护机制。报告同时指出,Sonnet 5 在不当行为发生率上仍高于 Opus 4.8,也高于严格限制版的 Claude Mythos Preview。
常见问题
Claude Sonnet 5 何时设为 Free 与 Pro 用户的预设模型?
Anthropic 于 2026 年 7 月 1 日正式发布 Claude Sonnet 5 的同日,将其设为 Free 与 Pro 用户的预设模型。
Anthropic 公布的跑分是否有第三方验证?
Anthropic 公布的所有 Claude Sonnet 5 跑分均为官方自评数据。Anthropic 未提供第三方独立验证报告,亦未说明预计提交第三方验证的时间表。
新版 tokenizer 对 API 用户账单有何影响?
Anthropic 说明相同输入在新 tokenizer 下产生的 token 数量为前代的 1.0 至 1.35 倍,官方声称定价已调整为「大致成本中性」。Anthropic 建议高流量用户自行执行基准测试,以评估实际账单影响,并未保证所有场景下账单不会上升。
免责声明:以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。
本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com,本站相关工作人员将会进行核查处理回复