LLMRank 中文 LLM 综合参考

国际线 · xAI 黑马 vs OpenAI 新主力

GPT-5.4 vs Grok 4.3

OpenAI 主力中档，105 万上下文，比 5.5 便宜一半但智能差距不到 20%

覆盖数据源 2 / 5

xAI 的性价比旗舰，输出快、价格低，跑量不心疼

覆盖数据源 3 / 5

TL;DR

Grok 4.3 智能高 5.3 分 + 便宜 6 倍 + Agentic 高 7.7 分，GPT-5.4 只有 OpenAI 生态优势——非生态绑定用户选 Grok。

关键差异

AA Intelligence：Grok 4.3 (53.20) > GPT-5.4 (47.94)，差 5.3 分
AA Agentic：Grok 4.3 (65.89) > GPT-5.4 (58.22)，差 7.7 分
输出价：Grok $2.50 vs GPT-5.4 $15.00，Grok 便宜 6 倍
OpenRouter 用量：两者都没进 Top 10——社区生态都在早期

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-14

指标	GPT-5.4	Grok 4.3	优胜
AA 综合智能（Intelligence Index）越高越好	47.94	53.20	B
AA 代码能力（Coding Index）越高越好	45.57	41.03	A
AA Agent 能力（Agentic Index）越高越好	58.22	65.89	B
输入价格（$ / 百万 token）越低越好	$2.50	$1.25	B
输出价格（$ / 百万 token）越低越好	$15.00	$2.50	B
输出速度（token / 秒）越高越好	71.7	94.5	B
上下文窗口越大越好	1050K	1000K	A

价格差距：GPT-5.4 输出价比 Grok 4.3 贵 6.00 倍（$15 vs $2.5）

A = GPT-5.4，B = Grok 4.3。空缺值表示该数据源未收录此模型，不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12

分类	GPT-5.4	Grok 4.3
综合对话（Text）	未进 Top 10	#9 · 1480
联网检索（Search）	未进 Top 10	#10 · 1209

只显示 Top 10 内出现的分类。同一模型不同变体（thinking / search 等）取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

国内可用性 & OpenRouter 用量

GPT-5.4

国内可用性需代理
OpenRouter 本周未进 Top 10
价格最近核验 2026-05-12

Grok 4.3

国内可用性需代理
OpenRouter 本周未进 Top 10
价格最近核验 2026-05-12

OpenRouter 用量榜抓取于 2026-05-12，反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首，参考时注意是「跑量」而不是「能力」。

怎么选

选 GPT-5.4，如果你：

OpenAI 生态已建好（function calling / 工具链）、需要 GPT 系列兼容、品牌/合规要求指定 OpenAI。

选 Grok 4.3，如果你：

性价比（输出 $2.50 vs $15，便宜 6 倍）、智能分更高（53.20 vs 47.94）、xAI 社区/推特生态。

还在比的其他对

国际线 · OpenAI 新主力 vs Claude 主力

Claude Sonnet 4.6 vs GPT-5.4

跨境 · 国际中档 vs 国内旗舰

DeepSeek V4 Pro vs GPT-5.4

跨境 · xAI 性价比 vs Claude 主力

Claude Sonnet 4.6 vs Grok 4.3

跨境 · 性价比之王对决

DeepSeek V4 Pro vs Grok 4.3

← 看所有对比回模型库 →