2026-05-14 · 价格监控

2026 年 5 月 LLM API 价格变动：谁涨谁降，怎么应对

5 月 14 日对 OpenRouter 价格表做了全量复核，4 款模型调价。这篇不是逐条罗列数字，而是告诉你哪些变动值得换供应商、哪些只是小幅波动、哪些模型反而更值了。

DeepSeek V4 Flash 再降 10%，输出价压到 $0.252/M。 这已经是近两个月第二次降价（4 月从 $0.35 降到 $0.28，5 月再从 $0.28 降到 $0.252）。按当前汇率，百万 token 输出费不到 1.8 元人民币——跑一个 5000 字的回答，输出成本约 9 毛钱。如果你还在用其他国内厂商做批量任务，现在没有任何理由不试试 DeepSeek。

GLM 5.1 涨价 7%-14%，智谱开始从「价格屠夫」转向「价值定价」。 输入从 $0.98 涨到 $1.05，输出从 $3.08 涨到 $3.50。虽然涨幅不算大，但这是 GLM 5.1 发布以来首次涨价，信号意义大于数字本身。

MiniMax M2.7 输入价涨 40%，但输出价不动——可能是成本结构变化。 输入从 $0.20 涨到 $0.28，输出维持 $1.20。对大多数应用来说，输入 token 通常比输出多 2-5 倍，这次涨价对总成本的实际影响在 15%-25% 之间。

GLM 4.6 老型号「输入涨、输出降」，智谱在引导用户上 5.1。 输入从 $0.39 涨到 $0.43（+10%），输出从 $1.90 降到 $1.74（-8%）。老用户如果输出比例高，成本反而降了；但输入涨价意味着提示工程越复杂、成本越高——这是在推你升级。

四款模型变动一览

下面这张表只列有变动的模型，没变动的（Kimi K2.6、Claude 系列、GPT 系列等）不显示。所有价格单位都是 USD / 百万 token。

模型	旧输入	新输入	旧输出	新输出	方向
DeepSeek V4 Flash DeepSeek	$0.14	$0.126	$0.280	$0.252	降 10%
GLM 5.1 智谱 AI	$0.98	$1.05	$3.08	$3.50	涨 7%-14%
MiniMax M2.7 MiniMax	$0.20	$0.28	$1.20	$1.20	输入涨 40%
GLM 4.6 智谱 AI · 上代	$0.39	$0.43	$1.90	$1.74	涨跌互现

逐条分析：为什么变、对你有什么影响

DeepSeek V4 Flash：再降 10%，性价比天花板又抬高了

新价格：输入 $0.13 / 输出 $0.25/M。这是 DeepSeek 连续第二个月降价。4 月初 V4 系列发布时，Flash 定价 $0.35/M 输出就已经让同行皱眉； 4 月中降到 $0.28，5 月再降到 $0.252。

对实际成本的影响：假设一个典型客服场景，输入 2000 token、输出 500 token，单轮成本 = 2000 × $0.000000126 + 500 × $0.000000252 = $0.000378，约人民币 0.27 分——调一千次不到 3 块钱。

但别因为这个价格就无脑上 Flash。它的 AA Intelligence 只有 46.52，在复杂推理场景会出错。适合：客服、内容分类、简单摘要、批量数据清洗。不适合：医疗诊断、金融分析、代码审查——这些场景省下的 API 费抵不上一次错误决策的代价。

GLM 5.1：首次涨价，智谱的定价策略在转向

新价格：输入 $1.05 / 输出 $3.50/M。输入涨 7%（$0.98→$1.05），输出涨 14%（$3.08→$3.50）。输出涨幅更大，说明智谱认为 GLM 5.1 的生成质量值得溢价。

横向对比：GLM 5.1 的输出价 $3.50/M，比 Kimi K2.6（$3.50）持平，比 DeepSeek V4 Pro（$0.87）贵 4 倍，比 Claude Sonnet 4.6（$15.0）便宜 76%。在国内厂商里，GLM 5.1 现在和 Kimi 同档定价，但 AA Intelligence 51.41 比 Kimi 的 53.9 低 2.5 分—— 定价追上了，能力还没完全追上。

对现有用户的影响：如果月调用量在 1000 万次输出 token 以上，每月多支出约 $420（约 3000 元）。不算致命，但如果预算卡得紧，可以考虑把部分流量切到 DeepSeek V4 Pro（$0.87/M 输出，智能还高 0.1 分）。

MiniMax M2.7：输入涨 40%，但输出不动——成本结构变了

新价格：输入 $0.28 / 输出 $1.20/M。输入从 $0.20 涨到 $0.28，输出维持 $1.20。这次调价很特殊：只涨输入不涨输出，说明 MiniMax 的成本压力主要在 prompt 处理侧（可能是上下文窗口扩展或预处理开销）。

实际影响要看你的输入输出比。一般应用里输入 token 是输出的 2-5 倍：

输入输出比 2:1 时，总成本涨约 15%
输入输出比 5:1 时，总成本涨约 25%
RAG 场景（输入极长、输出较短），总成本可能涨 30% 以上

MiniMax 的竞争优势本来就在"国内 Top 10 里最便宜"，涨价后这个标签还在—— 输入 $0.28/M 仍然比 Kimi（$0.74）和 Qwen3.6 Plus（$0.325）便宜。但如果再涨一次，就得重新评估了。

GLM 4.6：输入涨、输出降，智谱在推你升级

新价格：输入 $0.43 / 输出 $1.74/M。输入 $0.39→$0.43（+10%），输出 $1.90→$1.74（-8%）。 GLM 4.6 是上一代型号，智谱显然在用它做"价格杠杆"引导用户迁移到 5.1。

算一笔账：如果你的应用输出比例高（比如文章生成、长文续写），这次变动反而是利好—— 输出降了 $0.16/M。但如果输入比例高（RAG、多轮对话），成本会增加。

更值得问的是：为什么还要用 GLM 4.6？ 5.1 的输出虽然涨到 $3.50，但上下文从 202K 升到 1M，智能分从 49.77 升到 51.41，WebDev 能力更是从榜外冲到第 5。除非是已经深度集成、切换成本极高的存量系统，否则新项目没有理由选 4.6。

涨价后的国内厂商价格梯队

把国内厂商当代主力按输出价排一遍，看看 GLM 5.1 和 MiniMax 涨价后，梯队有没有变：

模型	输出价 $/M	AA 智能分	性价比 $/分	变动
DeepSeek V4 Flash	$0.252	46.52	$0.0054	↓ 降
DeepSeek V4 Pro	$0.870	51.51	$0.0169	—
MiniMax M2.7	$1.200	49.62	$0.0242	↑ 输入涨
MiMo-V2.5-Pro	$3.000	53.83	$0.0557	—
Kimi K2.6	$3.500	53.90	$0.0649	—
GLM 5.1	$3.500	51.41	$0.0681	↑ 涨
Qwen3.6 Max Preview	$6.240	51.81	$0.1203	—

梯队没有根本变化，但差距在缩小。 DeepSeek V4 Flash 依然是一骑绝尘的便宜；DeepSeek V4 Pro 和 MiniMax M2.7 组成"中端性价比"档； MiMo、Kimi、GLM 5.1 在 $3.0-3.5 的输出价上打成平手。

值得注意的是，GLM 5.1 涨价后和 Kimi K2.6 同价了（都是 $3.50/M 输出），但智能分 51.41 比 Kimi 的 53.9 低 2.5 分。这意味着在"同等价格"竞争里，GLM 5.1 现在处于下风——除非你在乎的是它的 WebDev 能力（LMArena 第 5）或 1M 上下文。

给你的三条建议

1. 批量任务还没切 DeepSeek 的，现在切

$0.252/M 的输出价是行业最低档，没有之一。如果你的应用有"大量简单问答、内容分类、数据标注"这类场景，用 DeepSeek V4 Flash 替代任何 $1+/M 的模型，成本能降 70%-90%。唯一要注意的是：Flash 的智能分确实低，复杂任务别硬上。

2. GLM 5.1 用户评估一下 WebDev 能力是否值这个溢价

涨价后 GLM 5.1 的输出价和 Kimi K2.6 持平，但智能分低 2.5 分。如果你用 GLM 5.1 主要是做前端代码（它 LMArena WebDev 第 5，确实强），那涨价后仍然值得。如果是做通用对话、分析、写作——同价位 Kimi K2.6 的智能分更高，MiMo-V2.5-Pro 的输出价还便宜 $0.50/M。

3. 建立价格监控机制，别等账单来了才发现

这次复核是人工抓的，但厂商调价越来越频繁。建议至少每月跑一次价格对账：对比 OpenRouter 价格表和你实际在付的价，特别是如果走中间商（如硅基流动、OpenRouter 代理），中间商的加价策略可能和厂商不同步。

LLMRank 的价格表每月复核一次，有变动会在这里更新。你也可以直接订阅 OpenRouter API，自己写脚本 diff。

数据来源与方法

价格数据： OpenRouter API，抓取于 2026-05-14。OpenRouter 聚合了各家厂商的官方定价，和直接走厂商官网的价格基本一致（偶有中间商加价差异）。
旧价格： 来自 2026-05-12 的 OpenRouter 抓取记录，和 2026-04 月的历史快照交叉验证。
智能分： 来自 Artificial Analysis Intelligence Index，用于横向比较"同样的钱能买到多少智能"。
更新频率： 价格表建议每月复核；评测数据（AA、LMArena、SuperCLUE）建议按各自更新周期跟进。