国际线 · OpenAI 新主力 vs Claude 主力
Claude Sonnet 4.6 vs GPT-5.4
TL;DR
定价完全一样($2.5/$15),但 Sonnet 4.6 Coding 高 5.4 分 + LMArena WebDev 第 6——写代码选 Claude,通用任务 GPT-5.4 略便宜。
关键差异
- AA Intelligence:Sonnet 4.6 (51.72) > GPT-5.4 (47.94),差 3.8 分
- AA Coding:Sonnet 4.6 (50.94) > GPT-5.4 (45.57),差 5.4 分
- 输出价:都是 $15/M——同价不同质
- Agentic:Sonnet 4.6 (63.00) > GPT-5.4 (58.22),差 4.8 分
关键指标逐项对比
AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-14| 指标 | Claude Sonnet 4.6 | GPT-5.4 | 优胜 |
|---|---|---|---|
| AA 综合智能(Intelligence Index) 越高越好 | 51.72 | 47.94 | A |
| AA 代码能力(Coding Index) 越高越好 | 50.94 | 45.57 | A |
| AA Agent 能力(Agentic Index) 越高越好 | 63.00 | 58.22 | A |
| 输入价格($ / 百万 token) 越低越好 | $3.00 | $2.50 | B |
| 输出价格($ / 百万 token) 越低越好 | $15.00 | $15.00 | ≈ |
| 输出速度(token / 秒) 越高越好 | 51 | 71.7 | B |
| 上下文窗口 越大越好 | 1000K | 1050K | B |
价格差距:输出价相同($15)
A = Claude Sonnet 4.6,B = GPT-5.4。空缺值表示该数据源未收录此模型,不参与优胜判定。
LMArena · 人类盲测各分类
抓取于 2026-05-12| 分类 | Claude Sonnet 4.6 | GPT-5.4 |
|---|---|---|
| 联网检索(Search) | #5 · 1221 | 未进 Top 10 |
| 前端开发(WebDev) | #6 · 1524 | 未进 Top 10 |
只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。
国内可用性 & OpenRouter 用量
Claude Sonnet 4.6
- 国内可用性 需代理
- OpenRouter 本周 #3 · 1.49T
- 价格最近核验 2026-05-12
GPT-5.4
- 国内可用性 需代理
- OpenRouter 本周 未进 Top 10
- 价格最近核验 2026-05-12
OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。
怎么选
选 Claude Sonnet 4.6,如果你:
代码/前端主力(AA Coding 50.94 vs 45.57)、LMArena WebDev 第 6、Cursor/Cline 默认主力。
选 GPT-5.4,如果你:
已经在用 OpenAI 生态(GPT-5.5 太贵想降档)、通用对话/分析、不在乎 Coding 差距。