2026-05-14 · 价格监控

2026 年 5 月 LLM API 价格变动:谁涨谁降,怎么应对

5 月 14 日对 OpenRouter 价格表做了全量复核,4 款模型调价。 这篇不是逐条罗列数字,而是告诉你哪些变动值得换供应商、哪些只是小幅波动、哪些模型反而更值了

DeepSeek V4 Flash 再降 10%,输出价压到 $0.252/M。 这已经是近两个月第二次降价(4 月从 $0.35 降到 $0.28,5 月再从 $0.28 降到 $0.252)。 按当前汇率,百万 token 输出费不到 1.8 元人民币——跑一个 5000 字的回答,输出成本约 9 毛钱。 如果你还在用其他国内厂商做批量任务,现在没有任何理由不试试 DeepSeek。

GLM 5.1 涨价 7%-14%,智谱开始从「价格屠夫」转向「价值定价」。 输入从 $0.98 涨到 $1.05,输出从 $3.08 涨到 $3.50。 虽然涨幅不算大,但这是 GLM 5.1 发布以来首次涨价,信号意义大于数字本身。

MiniMax M2.7 输入价涨 40%,但输出价不动——可能是成本结构变化。 输入从 $0.20 涨到 $0.28,输出维持 $1.20。 对大多数应用来说,输入 token 通常比输出多 2-5 倍,这次涨价对总成本的实际影响在 15%-25% 之间。

GLM 4.6 老型号「输入涨、输出降」,智谱在引导用户上 5.1。 输入从 $0.39 涨到 $0.43(+10%),输出从 $1.90 降到 $1.74(-8%)。 老用户如果输出比例高,成本反而降了;但输入涨价意味着提示工程越复杂、成本越高——这是在推你升级。

四款模型变动一览

下面这张表只列有变动的模型,没变动的(Kimi K2.6、Claude 系列、GPT 系列等)不显示。 所有价格单位都是 USD / 百万 token。

模型 旧输入 新输入 旧输出 新输出 方向
DeepSeek V4 Flash
DeepSeek
$0.14 $0.126 $0.280 $0.252 降 10%
GLM 5.1
智谱 AI
$0.98 $1.05 $3.08 $3.50 涨 7%-14%
MiniMax M2.7
MiniMax
$0.20 $0.28 $1.20 $1.20 输入涨 40%
GLM 4.6
智谱 AI · 上代
$0.39 $0.43 $1.90 $1.74 涨跌互现

逐条分析:为什么变、对你有什么影响

DeepSeek V4 Flash:再降 10%,性价比天花板又抬高了

新价格:输入 $0.13 / 输出 $0.25/M。 这是 DeepSeek 连续第二个月降价。4 月初 V4 系列发布时,Flash 定价 $0.35/M 输出就已经让同行皱眉; 4 月中降到 $0.28,5 月再降到 $0.252。

对实际成本的影响:假设一个典型客服场景,输入 2000 token、输出 500 token, 单轮成本 = 2000 × $0.000000126 + 500 × $0.000000252 = $0.000378, 约人民币 0.27 分——调一千次不到 3 块钱。

但别因为这个价格就无脑上 Flash。它的 AA Intelligence 只有 46.52,在复杂推理场景会出错。 适合:客服、内容分类、简单摘要、批量数据清洗。 不适合:医疗诊断、金融分析、代码审查——这些场景省下的 API 费抵不上一次错误决策的代价。

GLM 5.1:首次涨价,智谱的定价策略在转向

新价格:输入 $1.05 / 输出 $3.50/M。输入涨 7%($0.98→$1.05),输出涨 14%($3.08→$3.50)。 输出涨幅更大,说明智谱认为 GLM 5.1 的生成质量值得溢价。

横向对比:GLM 5.1 的输出价 $3.50/M,比 Kimi K2.6($3.50)持平,比 DeepSeek V4 Pro($0.87)贵 4 倍, 比 Claude Sonnet 4.6($15.0)便宜 76%。 在国内厂商里,GLM 5.1 现在和 Kimi 同档定价,但 AA Intelligence 51.41 比 Kimi 的 53.9 低 2.5 分—— 定价追上了,能力还没完全追上。

对现有用户的影响:如果月调用量在 1000 万次输出 token 以上,每月多支出约 $420(约 3000 元)。 不算致命,但如果预算卡得紧,可以考虑把部分流量切到 DeepSeek V4 Pro($0.87/M 输出,智能还高 0.1 分)。

MiniMax M2.7:输入涨 40%,但输出不动——成本结构变了

新价格:输入 $0.28 / 输出 $1.20/M。输入从 $0.20 涨到 $0.28,输出维持 $1.20。 这次调价很特殊:只涨输入不涨输出,说明 MiniMax 的成本压力主要在 prompt 处理侧(可能是上下文窗口扩展或预处理开销)。

实际影响要看你的输入输出比。一般应用里输入 token 是输出的 2-5 倍:

  • 输入输出比 2:1 时,总成本涨约 15%
  • 输入输出比 5:1 时,总成本涨约 25%
  • RAG 场景(输入极长、输出较短),总成本可能涨 30% 以上

MiniMax 的竞争优势本来就在"国内 Top 10 里最便宜",涨价后这个标签还在—— 输入 $0.28/M 仍然比 Kimi($0.74)和 Qwen3.6 Plus($0.325)便宜。 但如果再涨一次,就得重新评估了。

GLM 4.6:输入涨、输出降,智谱在推你升级

新价格:输入 $0.43 / 输出 $1.74/M。输入 $0.39→$0.43(+10%),输出 $1.90→$1.74(-8%)。 GLM 4.6 是上一代型号,智谱显然在用它做"价格杠杆"引导用户迁移到 5.1。

算一笔账:如果你的应用输出比例高(比如文章生成、长文续写),这次变动反而是利好—— 输出降了 $0.16/M。但如果输入比例高(RAG、多轮对话),成本会增加。

更值得问的是:为什么还要用 GLM 4.6? 5.1 的输出虽然涨到 $3.50,但上下文从 202K 升到 1M,智能分从 49.77 升到 51.41,WebDev 能力更是从榜外冲到第 5。 除非是已经深度集成、切换成本极高的存量系统,否则新项目没有理由选 4.6。

涨价后的国内厂商价格梯队

把国内厂商当代主力按输出价排一遍,看看 GLM 5.1 和 MiniMax 涨价后,梯队有没有变:

模型 输出价 $/M 变动
DeepSeek V4 Flash $0.252 ↓ 降
DeepSeek V4 Pro $0.870
MiniMax M2.7 $1.200 ↑ 输入涨
MiMo-V2.5-Pro $3.000
Kimi K2.6 $3.500
GLM 5.1 $3.500 ↑ 涨
Qwen3.6 Max Preview $6.240

梯队没有根本变化,但差距在缩小。 DeepSeek V4 Flash 依然是一骑绝尘的便宜;DeepSeek V4 Pro 和 MiniMax M2.7 组成"中端性价比"档; MiMo、Kimi、GLM 5.1 在 $3.0-3.5 的输出价上打成平手。

值得注意的是,GLM 5.1 涨价后和 Kimi K2.6 同价了(都是 $3.50/M 输出), 但智能分 51.41 比 Kimi 的 53.9 低 2.5 分。 这意味着在"同等价格"竞争里,GLM 5.1 现在处于下风——除非你在乎的是它的 WebDev 能力(LMArena 第 5)或 1M 上下文。

给你的三条建议

1. 批量任务还没切 DeepSeek 的,现在切

$0.252/M 的输出价是行业最低档,没有之一。 如果你的应用有"大量简单问答、内容分类、数据标注"这类场景, 用 DeepSeek V4 Flash 替代任何 $1+/M 的模型,成本能降 70%-90%。 唯一要注意的是:Flash 的智能分确实低,复杂任务别硬上。

2. GLM 5.1 用户评估一下 WebDev 能力是否值这个溢价

涨价后 GLM 5.1 的输出价和 Kimi K2.6 持平,但智能分低 2.5 分。 如果你用 GLM 5.1 主要是做前端代码(它 LMArena WebDev 第 5,确实强),那涨价后仍然值得。 如果是做通用对话、分析、写作——同价位 Kimi K2.6 的智能分更高,MiMo-V2.5-Pro 的输出价还便宜 $0.50/M。

3. 建立价格监控机制,别等账单来了才发现

这次复核是人工抓的,但厂商调价越来越频繁。 建议至少每月跑一次价格对账:对比 OpenRouter 价格表和你实际在付的价, 特别是如果走中间商(如硅基流动、OpenRouter 代理),中间商的加价策略可能和厂商不同步。

LLMRank 的价格表每月复核一次,有变动会在这里更新。 你也可以直接订阅 OpenRouter API, 自己写脚本 diff。

数据来源与方法

  • 价格数据: OpenRouter API, 抓取于 2026-05-14。OpenRouter 聚合了各家厂商的官方定价,和直接走厂商官网的价格基本一致(偶有中间商加价差异)。
  • 旧价格: 来自 2026-05-12 的 OpenRouter 抓取记录,和 2026-04 月的历史快照交叉验证。
  • 智能分: 来自 Artificial Analysis Intelligence Index,用于横向比较"同样的钱能买到多少智能"。
  • 更新频率: 价格表建议每月复核;评测数据(AA、LMArena、SuperCLUE)建议按各自更新周期跟进。

相关阅读