同家族 · 智谱升级

GLM-5 vs GLM 5.1

TL;DR

GLM-5.1 智能高 1.6 分 + LMArena WebDev 第 5 前端黑马,但 GLM-5 便宜 45%——日常用 GLM-5 足够,前端项目上 5.1。

关键差异

  • AA Intelligence:GLM-5.1 (51.41) > GLM-5 (49.77),差 1.6 分
  • LMArena WebDev:GLM-5.1 第 5,GLM-5 没进 Top 10——前端方向差距大
  • 输出价:GLM-5 $1.92 vs GLM-5.1 $3.50,GLM-5 便宜 45%
  • SuperCLUE:GLM-5.1 国内 #3 (71.32),GLM-5 国内 #6 (68.85)——中文榜差距约 2.5 分

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-14
指标 GLM-5 GLM 5.1 优胜
AA 综合智能(Intelligence Index) 越高越好 49.77 51.41 B
AA 代码能力(Coding Index) 越高越好 44.18 43.37 A
AA Agent 能力(Agentic Index) 越高越好 63.14 67.05 B
输入价格($ / 百万 token) 越低越好 $0.60 $1.05 A
输出价格($ / 百万 token) 越低越好 $1.92 $3.50 A
输出速度(token / 秒) 越高越好 75.5 56.8 A
上下文窗口 越大越好 203K 203K

价格差距:GLM 5.1 输出价比 GLM-5 贵 1.82 倍($3.5 vs $1.92)

A = GLM-5,B = GLM 5.1。空缺值表示该数据源未收录此模型,不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12
分类 GLM-5 GLM 5.1
前端开发(WebDev) 未进 Top 10 #5 · 1531

只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

SuperCLUE · 中文能力测评

2026年3月
维度 GLM-5 GLM 5.1
收录条目 GLM-5 未收录
综合总分 64.27 · 榜单 #11
代码生成 58.32
数学推理 73.95
智能体(任务规划) 66.64
精确指令遵循 24.86

GLM 5.1 未收录:SuperCLUE 3 月榜里是 GLM-5(总分 64.27 国内榜第 8),5.1 是 4 月升级版。

国内可用性 & OpenRouter 用量

GLM-5
  • 国内可用性 可用
  • OpenRouter 本周 未进 Top 10
  • 价格最近核验 2026-05-12
GLM 5.1
  • 国内可用性 可用
  • OpenRouter 本周 未进 Top 10
  • 价格最近核验 2026-05-14

OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。

怎么选

GLM-5,如果你:

预算敏感(输出 $1.92 vs $3.50,便宜 45%)、通用日常任务、GLM 生态已接入。

GLM 5.1,如果你:

前端 UI 开发(LMArena WebDev 第 5)、需要更高智能分(51.41 vs 49.77)、能接受涨价。

还在比的其他对