LLMRank 中文 LLM 综合参考

国内线 · 前端 vs 通用

GLM 5.1 vs Kimi K2.6

Z.ai (智谱) · 🇨🇳

前端工程黑马——LMArena WebDev 第 5 名，比 Claude Sonnet 还前面

覆盖数据源 3 / 5

Moonshot AI · 🇨🇳

AA 中国榜第一，OpenRouter 周用量榜第 2，国内代码/Agent 主力

覆盖数据源 4 / 5

TL;DR

Kimi K2.6 综合能力强一档（AA 中国 #1），但 GLM-5.1 LMArena WebDev 第 5 比 Kimi 还前面——前端项目反向选 GLM。

关键差异

AA Intelligence：Kimi K2.6 (53.92) > GLM-5.1 (51.41)，差 2.5 分
AA Coding：Kimi K2.6 (48.06) > GLM-5.1 (43.37)，差 4.7 分
LMArena WebDev：GLM-5.1 第 5 > Kimi K2.6 第 7——前端反超
输出价：GLM $4.4 vs Kimi $4，相差不大

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-12

指标	GLM 5.1	Kimi K2.6	优胜
AA 综合智能（Intelligence Index）越高越好	51.41	53.90	B
AA 代码能力（Coding Index）越高越好	43.37	47.12	B
AA Agent 能力（Agentic Index）越高越好	67.05	65.97	A
输入价格（$ / 百万 token）越低越好	$0.98	$0.74	B
输出价格（$ / 百万 token）越低越好	$3.08	$3.50	A
输出速度（token / 秒）越高越好	56.8	49.3	A
上下文窗口越大越好	203K	33K	A

价格差距：Kimi K2.6 输出价比 GLM 5.1 贵 1.14 倍（$3.5 vs $3.08）

A = GLM 5.1，B = Kimi K2.6。空缺值表示该数据源未收录此模型，不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12

分类	GLM 5.1	Kimi K2.6
前端开发（WebDev）	#5 · 1531	#7 · 1523

只显示 Top 10 内出现的分类。同一模型不同变体（thinking / search 等）取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

国内可用性 & OpenRouter 用量

GLM 5.1

国内可用性可用
OpenRouter 本周未进 Top 10
价格最近核验 2026-05-12

Kimi K2.6

国内可用性可用
OpenRouter 本周 #2 · 1.53T
价格最近核验 2026-05-12

OpenRouter 用量榜抓取于 2026-05-12，反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首，参考时注意是「跑量」而不是「能力」。

怎么选

选 GLM 5.1，如果你：

前端 UI 开发、React/Vue 组件生成（LMArena WebDev 第 5 国内最高）、智谱开放平台合规场景（发票/合同齐）。

选 Kimi K2.6，如果你：

通用代码 + Agent 主力（AA 中国第 1）、OpenRouter 用量第 2 的社区生态、需要中文写作 + 工具调用的均衡场景。

还在比的其他对

国内线 · 通用 vs 前端黑马

DeepSeek V4 Pro vs GLM 5.1

国内线 · 智谱 vs 阿里

GLM 5.1 vs Qwen3.6 Max Preview

国内线 · 双雄对决

DeepSeek V4 Pro vs Kimi K2.6

国内线 · Moonshot vs 阿里

Kimi K2.6 vs Qwen3.6 Max Preview

跨境 · 国际主力 vs 国内旗舰

Claude Sonnet 4.6 vs Kimi K2.6

← 看所有对比回模型库 →