国内线 · 前端 vs 通用

GLM 5.1 vs Kimi K2.6

TL;DR

Kimi K2.6 综合能力强一档(AA 中国 #1),但 GLM-5.1 LMArena WebDev 第 5 比 Kimi 还前面——前端项目反向选 GLM。

关键差异

  • AA Intelligence:Kimi K2.6 (53.92) > GLM-5.1 (51.41),差 2.5 分
  • AA Coding:Kimi K2.6 (48.06) > GLM-5.1 (43.37),差 4.7 分
  • LMArena WebDev:GLM-5.1 第 5 > Kimi K2.6 第 7——前端反超
  • 输出价:GLM $4.4 vs Kimi $4,相差不大

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-12
指标 GLM 5.1 Kimi K2.6 优胜
AA 综合智能(Intelligence Index) 越高越好 51.41 53.90 B
AA 代码能力(Coding Index) 越高越好 43.37 47.12 B
AA Agent 能力(Agentic Index) 越高越好 67.05 65.97 A
输入价格($ / 百万 token) 越低越好 $0.98 $0.74 B
输出价格($ / 百万 token) 越低越好 $3.08 $3.50 A
输出速度(token / 秒) 越高越好 56.8 49.3 A
上下文窗口 越大越好 203K 33K A

价格差距:Kimi K2.6 输出价比 GLM 5.1 贵 1.14 倍($3.5 vs $3.08)

A = GLM 5.1,B = Kimi K2.6。空缺值表示该数据源未收录此模型,不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12
分类 GLM 5.1 Kimi K2.6
前端开发(WebDev) #5 · 1531 #7 · 1523

只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

国内可用性 & OpenRouter 用量

GLM 5.1
  • 国内可用性 可用
  • OpenRouter 本周 未进 Top 10
  • 价格最近核验 2026-05-12
Kimi K2.6
  • 国内可用性 可用
  • OpenRouter 本周 #2 · 1.53T
  • 价格最近核验 2026-05-12

OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。

怎么选

GLM 5.1,如果你:

前端 UI 开发、React/Vue 组件生成(LMArena WebDev 第 5 国内最高)、智谱开放平台合规场景(发票/合同齐)。

Kimi K2.6,如果你:

通用代码 + Agent 主力(AA 中国第 1)、OpenRouter 用量第 2 的社区生态、需要中文写作 + 工具调用的均衡场景。

还在比的其他对