同家族 · 智谱升级
GLM-5 vs GLM 5.1
TL;DR
GLM-5.1 智能高 1.6 分 + LMArena WebDev 第 5 前端黑马,但 GLM-5 便宜 45%——日常用 GLM-5 足够,前端项目上 5.1。
关键差异
- AA Intelligence:GLM-5.1 (51.41) > GLM-5 (49.77),差 1.6 分
- LMArena WebDev:GLM-5.1 第 5,GLM-5 没进 Top 10——前端方向差距大
- 输出价:GLM-5 $1.92 vs GLM-5.1 $3.50,GLM-5 便宜 45%
- SuperCLUE:GLM-5.1 国内 #3 (71.32),GLM-5 国内 #6 (68.85)——中文榜差距约 2.5 分
关键指标逐项对比
AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-14| 指标 | GLM-5 | GLM 5.1 | 优胜 |
|---|---|---|---|
| AA 综合智能(Intelligence Index) 越高越好 | 49.77 | 51.41 | B |
| AA 代码能力(Coding Index) 越高越好 | 44.18 | 43.37 | A |
| AA Agent 能力(Agentic Index) 越高越好 | 63.14 | 67.05 | B |
| 输入价格($ / 百万 token) 越低越好 | $0.60 | $1.05 | A |
| 输出价格($ / 百万 token) 越低越好 | $1.92 | $3.50 | A |
| 输出速度(token / 秒) 越高越好 | 75.5 | 56.8 | A |
| 上下文窗口 越大越好 | 203K | 203K | ≈ |
价格差距:GLM 5.1 输出价比 GLM-5 贵 1.82 倍($3.5 vs $1.92)
A = GLM-5,B = GLM 5.1。空缺值表示该数据源未收录此模型,不参与优胜判定。
LMArena · 人类盲测各分类
抓取于 2026-05-12| 分类 | GLM-5 | GLM 5.1 |
|---|---|---|
| 前端开发(WebDev) | 未进 Top 10 | #5 · 1531 |
只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。
SuperCLUE · 中文能力测评
2026年3月| 维度 | GLM-5 | GLM 5.1 |
|---|---|---|
| 收录条目 | GLM-5 | 未收录 |
| 综合总分 | 64.27 · 榜单 #11 | — |
| 代码生成 | 58.32 | — |
| 数学推理 | 73.95 | — |
| 智能体(任务规划) | 66.64 | — |
| 精确指令遵循 | 24.86 | — |
GLM 5.1 未收录:SuperCLUE 3 月榜里是 GLM-5(总分 64.27 国内榜第 8),5.1 是 4 月升级版。
国内可用性 & OpenRouter 用量
GLM-5
- 国内可用性 可用
- OpenRouter 本周 未进 Top 10
- 价格最近核验 2026-05-12
GLM 5.1
- 国内可用性 可用
- OpenRouter 本周 未进 Top 10
- 价格最近核验 2026-05-14
OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。