国际线 · xAI 黑马 vs OpenAI 新主力
GPT-5.4 vs Grok 4.3
TL;DR
Grok 4.3 智能高 5.3 分 + 便宜 6 倍 + Agentic 高 7.7 分,GPT-5.4 只有 OpenAI 生态优势——非生态绑定用户选 Grok。
关键差异
- AA Intelligence:Grok 4.3 (53.20) > GPT-5.4 (47.94),差 5.3 分
- AA Agentic:Grok 4.3 (65.89) > GPT-5.4 (58.22),差 7.7 分
- 输出价:Grok $2.50 vs GPT-5.4 $15.00,Grok 便宜 6 倍
- OpenRouter 用量:两者都没进 Top 10——社区生态都在早期
关键指标逐项对比
AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-14| 指标 | GPT-5.4 | Grok 4.3 | 优胜 |
|---|---|---|---|
| AA 综合智能(Intelligence Index) 越高越好 | 47.94 | 53.20 | B |
| AA 代码能力(Coding Index) 越高越好 | 45.57 | 41.03 | A |
| AA Agent 能力(Agentic Index) 越高越好 | 58.22 | 65.89 | B |
| 输入价格($ / 百万 token) 越低越好 | $2.50 | $1.25 | B |
| 输出价格($ / 百万 token) 越低越好 | $15.00 | $2.50 | B |
| 输出速度(token / 秒) 越高越好 | 71.7 | 94.5 | B |
| 上下文窗口 越大越好 | 1050K | 1000K | A |
价格差距:GPT-5.4 输出价比 Grok 4.3 贵 6.00 倍($15 vs $2.5)
A = GPT-5.4,B = Grok 4.3。空缺值表示该数据源未收录此模型,不参与优胜判定。
LMArena · 人类盲测各分类
抓取于 2026-05-12| 分类 | GPT-5.4 | Grok 4.3 |
|---|---|---|
| 综合对话(Text) | 未进 Top 10 | #9 · 1480 |
| 联网检索(Search) | 未进 Top 10 | #10 · 1209 |
只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。
国内可用性 & OpenRouter 用量
GPT-5.4
- 国内可用性 需代理
- OpenRouter 本周 未进 Top 10
- 价格最近核验 2026-05-12
Grok 4.3
- 国内可用性 需代理
- OpenRouter 本周 未进 Top 10
- 价格最近核验 2026-05-12
OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。