LLMRank 中文 LLM 综合参考

同家族 · 智谱升级

GLM-5 vs GLM 5.1

Z AI (智谱) · 🇨🇳

智谱前代旗舰，SuperCLUE 第三、开源榜第三，被 GLM-5.1 背刺了

覆盖数据源 3 / 5

Z.ai (智谱) · 🇨🇳

前端工程黑马——LMArena WebDev 第 5 名，比 Claude Sonnet 还前面

覆盖数据源 3 / 5

TL;DR

GLM-5.1 智能高 1.6 分 + LMArena WebDev 第 5 前端黑马，但 GLM-5 便宜 45%——日常用 GLM-5 足够，前端项目上 5.1。

关键差异

AA Intelligence：GLM-5.1 (51.41) > GLM-5 (49.77)，差 1.6 分
LMArena WebDev：GLM-5.1 第 5，GLM-5 没进 Top 10——前端方向差距大
输出价：GLM-5 $1.92 vs GLM-5.1 $3.50，GLM-5 便宜 45%
SuperCLUE：GLM-5.1 国内 #3 (71.32)，GLM-5 国内 #6 (68.85)——中文榜差距约 2.5 分

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-14

指标	GLM-5	GLM 5.1	优胜
AA 综合智能（Intelligence Index）越高越好	49.77	51.41	B
AA 代码能力（Coding Index）越高越好	44.18	43.37	A
AA Agent 能力（Agentic Index）越高越好	63.14	67.05	B
输入价格（$ / 百万 token）越低越好	$0.60	$1.05	A
输出价格（$ / 百万 token）越低越好	$1.92	$3.50	A
输出速度（token / 秒）越高越好	75.5	56.8	A
上下文窗口越大越好	203K	203K	≈

价格差距：GLM 5.1 输出价比 GLM-5 贵 1.82 倍（$3.5 vs $1.92）

A = GLM-5，B = GLM 5.1。空缺值表示该数据源未收录此模型，不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12

分类	GLM-5	GLM 5.1
前端开发（WebDev）	未进 Top 10	#5 · 1531

只显示 Top 10 内出现的分类。同一模型不同变体（thinking / search 等）取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

SuperCLUE · 中文能力测评

2026年3月

维度	GLM-5	GLM 5.1
收录条目	GLM-5	未收录
综合总分	64.27 · 榜单 #11	—
代码生成	58.32	—
数学推理	73.95	—
智能体(任务规划)	66.64	—
精确指令遵循	24.86	—

GLM 5.1 未收录：SuperCLUE 3 月榜里是 GLM-5（总分 64.27 国内榜第 8），5.1 是 4 月升级版。

国内可用性 & OpenRouter 用量

GLM-5

国内可用性可用
OpenRouter 本周未进 Top 10
价格最近核验 2026-05-12

GLM 5.1

国内可用性可用
OpenRouter 本周未进 Top 10
价格最近核验 2026-05-14

OpenRouter 用量榜抓取于 2026-05-12，反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首，参考时注意是「跑量」而不是「能力」。

怎么选

选 GLM-5，如果你：

预算敏感（输出 $1.92 vs $3.50，便宜 45%）、通用日常任务、GLM 生态已接入。

选 GLM 5.1，如果你：

前端 UI 开发（LMArena WebDev 第 5）、需要更高智能分（51.41 vs 49.77）、能接受涨价。

还在比的其他对

国内线 · 前端 vs 通用

GLM 5.1 vs Kimi K2.6

国内线 · 通用 vs 前端黑马

DeepSeek V4 Pro vs GLM 5.1

国内线 · 智谱 vs 阿里

GLM 5.1 vs Qwen3.6 Max Preview

← 看所有对比回模型库 →