跨境 · xAI 性价比 vs Claude 主力

Claude Sonnet 4.6 vs Grok 4.3

TL;DR

Grok 4.3 输出价只有 Sonnet 4.6 的 1/6,但 Coding 差 10 分——代码选 Claude,跑量选 Grok。

关键差异

  • AA Intelligence:Grok 4.3 (53.20) > Sonnet 4.6 (51.72),差 1.5 分
  • AA Coding:Sonnet 4.6 (50.94) > Grok 4.3 (41.03),差 10 分——代码方向倒挂
  • 输出价:Grok $2.50 vs Sonnet $15.00,Grok 便宜 6 倍
  • OpenRouter 用量:Sonnet 4.6 第 3 (1.49T),Grok 没进 Top 10——社区生态差距大

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-14
指标 Claude Sonnet 4.6 Grok 4.3 优胜
AA 综合智能(Intelligence Index) 越高越好 51.72 53.20 B
AA 代码能力(Coding Index) 越高越好 50.94 41.03 A
AA Agent 能力(Agentic Index) 越高越好 63.00 65.89 B
输入价格($ / 百万 token) 越低越好 $3.00 $1.25 B
输出价格($ / 百万 token) 越低越好 $15.00 $2.50 B
输出速度(token / 秒) 越高越好 51 94.5 B
上下文窗口 越大越好 1000K 1000K

价格差距:Claude Sonnet 4.6 输出价比 Grok 4.3 贵 6.00 倍($15 vs $2.5)

A = Claude Sonnet 4.6,B = Grok 4.3。空缺值表示该数据源未收录此模型,不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12
分类 Claude Sonnet 4.6 Grok 4.3
联网检索(Search) #5 · 1221 #10 · 1209
前端开发(WebDev) #6 · 1524 未进 Top 10
综合对话(Text) 未进 Top 10 #9 · 1480

只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

国内可用性 & OpenRouter 用量

Claude Sonnet 4.6
  • 国内可用性 需代理
  • OpenRouter 本周 #3 · 1.49T
  • 价格最近核验 2026-05-12
Grok 4.3
  • 国内可用性 需代理
  • OpenRouter 本周 未进 Top 10
  • 价格最近核验 2026-05-12

OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。

怎么选

Claude Sonnet 4.6,如果你:

代码/前端主力(AA Coding 50.94 vs Grok 41.03)、Cursor/Cline 默认主力、LMArena WebDev 第 6。

Grok 4.3,如果你:

预算敏感、大量调用(输出 $2.50/M 只有 Sonnet 的 1/6)、xAI 社区产品已有接入。

还在比的其他对