LLMRank 中文 LLM 综合参考

跨境 · xAI 性价比 vs Claude 主力

Claude Sonnet 4.6 vs Grok 4.3

Claude Sonnet 4.6

国际线性价比最高的旗舰，开发者真金白银投票出来的主力

覆盖数据源 4 / 5

xAI 的性价比旗舰，输出快、价格低，跑量不心疼

覆盖数据源 3 / 5

TL;DR

Grok 4.3 输出价只有 Sonnet 4.6 的 1/6，但 Coding 差 10 分——代码选 Claude，跑量选 Grok。

关键差异

AA Intelligence：Grok 4.3 (53.20) > Sonnet 4.6 (51.72)，差 1.5 分
AA Coding：Sonnet 4.6 (50.94) > Grok 4.3 (41.03)，差 10 分——代码方向倒挂
输出价：Grok $2.50 vs Sonnet $15.00，Grok 便宜 6 倍
OpenRouter 用量：Sonnet 4.6 第 3 (1.49T)，Grok 没进 Top 10——社区生态差距大

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-14

指标	Claude Sonnet 4.6	Grok 4.3	优胜
AA 综合智能（Intelligence Index）越高越好	51.72	53.20	B
AA 代码能力（Coding Index）越高越好	50.94	41.03	A
AA Agent 能力（Agentic Index）越高越好	63.00	65.89	B
输入价格（$ / 百万 token）越低越好	$3.00	$1.25	B
输出价格（$ / 百万 token）越低越好	$15.00	$2.50	B
输出速度（token / 秒）越高越好	51	94.5	B
上下文窗口越大越好	1000K	1000K	≈

价格差距：Claude Sonnet 4.6 输出价比 Grok 4.3 贵 6.00 倍（$15 vs $2.5）

A = Claude Sonnet 4.6，B = Grok 4.3。空缺值表示该数据源未收录此模型，不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12

分类	Claude Sonnet 4.6	Grok 4.3
联网检索（Search）	#5 · 1221	#10 · 1209
前端开发（WebDev）	#6 · 1524	未进 Top 10
综合对话（Text）	未进 Top 10	#9 · 1480

只显示 Top 10 内出现的分类。同一模型不同变体（thinking / search 等）取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

国内可用性 & OpenRouter 用量

Claude Sonnet 4.6

国内可用性需代理
OpenRouter 本周 #3 · 1.49T
价格最近核验 2026-05-12

Grok 4.3

国内可用性需代理
OpenRouter 本周未进 Top 10
价格最近核验 2026-05-12

OpenRouter 用量榜抓取于 2026-05-12，反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首，参考时注意是「跑量」而不是「能力」。

怎么选

选 Claude Sonnet 4.6，如果你：

代码/前端主力（AA Coding 50.94 vs Grok 41.03）、Cursor/Cline 默认主力、LMArena WebDev 第 6。

选 Grok 4.3，如果你：

预算敏感、大量调用（输出 $2.50/M 只有 Sonnet 的 1/6）、xAI 社区产品已有接入。

还在比的其他对

同家族升级

Claude Opus 4.7 vs Claude Sonnet 4.6

国际线 · 主力 vs 旗舰

Claude Sonnet 4.6 vs GPT-5.5

国际线 · 主力对决

Claude Sonnet 4.6 vs Gemini 3.1 Pro Preview

跨境 · 性价比之王对决

DeepSeek V4 Pro vs Grok 4.3

国际线 · xAI 黑马 vs OpenAI 新主力

GPT-5.4 vs Grok 4.3

← 看所有对比回模型库 →