国际线 · xAI 黑马 vs OpenAI 新主力

GPT-5.4 vs Grok 4.3

TL;DR

Grok 4.3 智能高 5.3 分 + 便宜 6 倍 + Agentic 高 7.7 分,GPT-5.4 只有 OpenAI 生态优势——非生态绑定用户选 Grok。

关键差异

  • AA Intelligence:Grok 4.3 (53.20) > GPT-5.4 (47.94),差 5.3 分
  • AA Agentic:Grok 4.3 (65.89) > GPT-5.4 (58.22),差 7.7 分
  • 输出价:Grok $2.50 vs GPT-5.4 $15.00,Grok 便宜 6 倍
  • OpenRouter 用量:两者都没进 Top 10——社区生态都在早期

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-14
指标 GPT-5.4 Grok 4.3 优胜
AA 综合智能(Intelligence Index) 越高越好 47.94 53.20 B
AA 代码能力(Coding Index) 越高越好 45.57 41.03 A
AA Agent 能力(Agentic Index) 越高越好 58.22 65.89 B
输入价格($ / 百万 token) 越低越好 $2.50 $1.25 B
输出价格($ / 百万 token) 越低越好 $15.00 $2.50 B
输出速度(token / 秒) 越高越好 71.7 94.5 B
上下文窗口 越大越好 1050K 1000K A

价格差距:GPT-5.4 输出价比 Grok 4.3 贵 6.00 倍($15 vs $2.5)

A = GPT-5.4,B = Grok 4.3。空缺值表示该数据源未收录此模型,不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12
分类 GPT-5.4 Grok 4.3
综合对话(Text) 未进 Top 10 #9 · 1480
联网检索(Search) 未进 Top 10 #10 · 1209

只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

国内可用性 & OpenRouter 用量

GPT-5.4
  • 国内可用性 需代理
  • OpenRouter 本周 未进 Top 10
  • 价格最近核验 2026-05-12
Grok 4.3
  • 国内可用性 需代理
  • OpenRouter 本周 未进 Top 10
  • 价格最近核验 2026-05-12

OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。

怎么选

GPT-5.4,如果你:

OpenAI 生态已建好(function calling / 工具链)、需要 GPT 系列兼容、品牌/合规要求指定 OpenAI。

Grok 4.3,如果你:

性价比(输出 $2.50 vs $15,便宜 6 倍)、智能分更高(53.20 vs 47.94)、xAI 社区/推特生态。

还在比的其他对