DeepSeek 和小米将 AI 模型价格下调至最高 99%,而美国实验室上调成本

DeepSeek 和小米下调 API 定价,而美国实验室上调费率

DeepSeek 于 2026 年 5 月 22 日将 DeepSeek V4-Pro 的 75% 折扣永久化,将输出定价锁定为每百万 tokens 0.87 美元。小米于 2026 年 5 月 26 日跟进,将 MiMo-V2.5 API 价格对缓存输入最高下调 99%,Pro 模型现为每百万 tokens(缓存输入)0.0036 美元。此次降价源于推理框架与 KV cache 架构的技术优化。这些调整发生在 OpenAI 于 4 月下旬发布时将 GPT-5.5 输出价格翻倍至每百万 tokens 30 美元,以及 Anthropic 以新 tokenizer 出货 Claude Opus 4.7,该 tokenizer 对相同输入文本最多可产生 35% 更多 tokens,可能在费率卡不变的情况下推高实际成本。

宣布的永久定价变更

DeepSeek V4-Pro 现在每百万 tokens 输入 0.435 美元、输出 0.87 美元。原本设定于到期的 75% 折扣在本周早些时候变为永久。小米的 MiMo-V2.5-Pro 在 5 月 26 日的降价后,同样为每百万 tokens 0.435/0.87 美元。MiMo-V2.5 的缓存命中计费降至每百万 tokens 0.0036 美元。小米的计费升级让用户在相同价格下获得 5 到 8 倍更多 tokens。售价 100 美元的 Max 方案现在提供 820 亿 tokens,较 16 亿 tokens 提升。

降价背后的技术实现

小米 MiMo 团队负责人、曾是 DeepSeek 核心开发者并共同构建 DeepSeek-V2 的 Fuli Luo 于 5 月 27 日在 X 上发布了技术说明。推理框架现在支持针对 SWA 的层级 KV cache 优化。生产推理引擎测试表明,该优化可将缓存 token 容量提升约 5 倍。系统通过降低约 80% 的存储与处理成本实现。这位作者写道:“在这些新下调的 API 价格下,我们的生产推理引擎运行接近满负荷,并且我们仍基本可以做到收支平衡。”

DeepSeek V4 使用两种交错的注意力类型:一种对每 4 个 tokens 进行压缩以实现选择性注意力,另一种将每 128 个 tokens 折叠以形成全局上下文。在 100 万 tokens 的上下文下,V4-Pro 的 KV cache 仅为其前身的 10%。单 token 推理的运行成本为之前计算成本的 27%。

性能基准与对比定价

DeepSeek V4-Pro 在 SWE-Verified 上得分 80.6%。Claude Opus 4.6 在同一基准(用于衡量真实 GitHub issue 解决)上得分 80.8%。两款模型的定价差距:输出端为 34 倍。DeepSeek V4-Pro 是一个 1.6 万亿参数模型。

Claude Opus 4.7 的每百万输入 tokens 成本为 5 美元、每百万输出 tokens 为 25 美元。GPT-5.5 的每百万输出 tokens 为 30 美元,是其前身费率的 2 倍。Gemini 2.5 Pro 每百万 tokens 的输入为 1.25 美元、输出为 10 美元。

MiniMax M2.7 每百万 tokens 输入 0.30 美元、输出 1.20 美元。来自 Moonshot AI 的 Kimi K2.5(SWE-bench Verified 为 76.8%)运行成本为每百万 tokens 输入 0.60 美元、输出 2.50 美元。来自 Z.AI 的 GLM-5.1 在 2026 年 Q2 的编码基准中击败了 Claude Opus 4.6。4 个中国前沿模型在 5 月上旬 12 天窗口期内发布,全部低于 Opus 4.7 每 token 成本的三分之一。DeepSeek V4-Pro 对缓存输入 tokens 的成本为每百万 tokens 0.003625 美元。

各服务商间的市场定位

2026 年 Q2,中文和美国前沿模型之间的定价差距从 15x 到 30x 不等,取决于模型对照/比较方式。这一基准存在缓存折扣之前。Anthropic 将 Claude Opus 4.7 的费率卡保持不变,但随之推出了新的 tokenizer,该 tokenizer 可在相同输入文本下产生最多 35% 更多 tokens。

免责声明:以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。

本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com,本站相关工作人员将会进行核查处理回复

(0)
上一篇 2026年5月28日 上午1:50
下一篇 2026年5月28日 上午4:29

相关推荐

风险提示:理性看待区块链,提高风险意识!