LLMRank 中文 LLM 综合参考

国内线 · 智谱 vs 阿里

GLM 5.1 vs Qwen3.6 Max Preview

Z.ai (智谱) · 🇨🇳

前端工程黑马——LMArena WebDev 第 5 名，比 Claude Sonnet 还前面

覆盖数据源 3 / 5

Qwen3.6 Max Preview

Alibaba (阿里云百炼) · 🇨🇳

阿里云背书 + 1M 上下文，合规企业场景的国内首选

覆盖数据源 2 / 5

TL;DR

GLM-5.1 LMArena WebDev 第 5 前端黑马 + 便宜 40%，Qwen3.6 Max 1M 上下文 + 阿里云背书——前端选 GLM，长文档企业场景选 Qwen。

关键差异

AA Intelligence：Qwen3.6 Max (51.81) > GLM-5.1 (51.41)，几乎打平
LMArena WebDev：GLM-5.1 第 5，Qwen3.6 Max 没进 Top 10
输出价：GLM $4.4 vs Qwen $7.8，GLM 便宜近 45%
速度：GLM 56.8 token/s > Qwen 37.9 token/s，GLM 快 50%

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-12

指标	GLM 5.1	Qwen3.6 Max Preview	优胜
AA 综合智能（Intelligence Index）越高越好	51.41	51.81	B
AA 代码能力（Coding Index）越高越好	43.37	44.92	B
AA Agent 能力（Agentic Index）越高越好	67.05	64.83	A
输入价格（$ / 百万 token）越低越好	$0.98	$1.04	A
输出价格（$ / 百万 token）越低越好	$3.08	$6.24	A
输出速度（token / 秒）越高越好	56.8	37.9	A
上下文窗口越大越好	203K	262K	B

价格差距：Qwen3.6 Max Preview 输出价比 GLM 5.1 贵 2.03 倍（$6.24 vs $3.08）

A = GLM 5.1，B = Qwen3.6 Max Preview。空缺值表示该数据源未收录此模型，不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12

分类	GLM 5.1	Qwen3.6 Max Preview
前端开发（WebDev）	#5 · 1531	未进 Top 10

只显示 Top 10 内出现的分类。同一模型不同变体（thinking / search 等）取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

国内可用性 & OpenRouter 用量

GLM 5.1

国内可用性可用
OpenRouter 本周未进 Top 10
价格最近核验 2026-05-12

Qwen3.6 Max Preview

国内可用性可用
OpenRouter 本周未进 Top 10
价格最近核验 2026-05-12

OpenRouter 用量榜抓取于 2026-05-12，反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首，参考时注意是「跑量」而不是「能力」。

怎么选

选 GLM 5.1，如果你：

前端 UI 开发（LMArena WebDev 第 5 国内最高）、智谱合规场景、性价比敏感。

选 Qwen3.6 Max Preview，如果你：

1M 上下文 + 中文长文档、阿里云生态（SLA/发票合规）、政企客户。

还在比的其他对

国内线 · 前端 vs 通用

GLM 5.1 vs Kimi K2.6

国内线 · 通用 vs 前端黑马

DeepSeek V4 Pro vs GLM 5.1

国内线 · Moonshot vs 阿里

Kimi K2.6 vs Qwen3.6 Max Preview

国内线 · 开源 vs 阿里云背书

DeepSeek V4 Pro vs Qwen3.6 Max Preview

← 看所有对比回模型库 →