LLMRank 中文 LLM 综合参考

国际线 · OpenAI 新主力 vs Claude 主力

Claude Sonnet 4.6 vs GPT-5.4

Claude Sonnet 4.6

国际线性价比最高的旗舰，开发者真金白银投票出来的主力

覆盖数据源 4 / 5

OpenAI 主力中档，105 万上下文，比 5.5 便宜一半但智能差距不到 20%

覆盖数据源 2 / 5

TL;DR

定价完全一样（$2.5/$15），但 Sonnet 4.6 Coding 高 5.4 分 + LMArena WebDev 第 6——写代码选 Claude，通用任务 GPT-5.4 略便宜。

关键差异

AA Intelligence：Sonnet 4.6 (51.72) > GPT-5.4 (47.94)，差 3.8 分
AA Coding：Sonnet 4.6 (50.94) > GPT-5.4 (45.57)，差 5.4 分
输出价：都是 $15/M——同价不同质
Agentic：Sonnet 4.6 (63.00) > GPT-5.4 (58.22)，差 4.8 分

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-14

指标	Claude Sonnet 4.6	GPT-5.4	优胜
AA 综合智能（Intelligence Index）越高越好	51.72	47.94	A
AA 代码能力（Coding Index）越高越好	50.94	45.57	A
AA Agent 能力（Agentic Index）越高越好	63.00	58.22	A
输入价格（$ / 百万 token）越低越好	$3.00	$2.50	B
输出价格（$ / 百万 token）越低越好	$15.00	$15.00	≈
输出速度（token / 秒）越高越好	51	71.7	B
上下文窗口越大越好	1000K	1050K	B

价格差距：输出价相同（$15）

A = Claude Sonnet 4.6，B = GPT-5.4。空缺值表示该数据源未收录此模型，不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12

分类	Claude Sonnet 4.6	GPT-5.4
联网检索（Search）	#5 · 1221	未进 Top 10
前端开发（WebDev）	#6 · 1524	未进 Top 10

只显示 Top 10 内出现的分类。同一模型不同变体（thinking / search 等）取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

国内可用性 & OpenRouter 用量

Claude Sonnet 4.6

国内可用性需代理
OpenRouter 本周 #3 · 1.49T
价格最近核验 2026-05-12

GPT-5.4

国内可用性需代理
OpenRouter 本周未进 Top 10
价格最近核验 2026-05-12

OpenRouter 用量榜抓取于 2026-05-12，反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首，参考时注意是「跑量」而不是「能力」。

怎么选

选 Claude Sonnet 4.6，如果你：

代码/前端主力（AA Coding 50.94 vs 45.57）、LMArena WebDev 第 6、Cursor/Cline 默认主力。

选 GPT-5.4，如果你：

已经在用 OpenAI 生态（GPT-5.5 太贵想降档）、通用对话/分析、不在乎 Coding 差距。

还在比的其他对

同家族升级

Claude Opus 4.7 vs Claude Sonnet 4.6

国际线 · 主力 vs 旗舰

Claude Sonnet 4.6 vs GPT-5.5

国际线 · 主力对决

Claude Sonnet 4.6 vs Gemini 3.1 Pro Preview

跨境 · 国际中档 vs 国内旗舰

DeepSeek V4 Pro vs GPT-5.4

国际线 · xAI 黑马 vs OpenAI 新主力

GPT-5.4 vs Grok 4.3

← 看所有对比回模型库 →