GPT-5.4

OpenAI

OpenAI 主力中档,105 万上下文,比 5.5 便宜一半但智能差距不到 20%

发布日期:2026-03-05 · 覆盖数据源:2 / 5 (AA · Pricing)

OpenAI 的「主力档」定位,卡在 5.5 和 5.4 Mini 之间。AA Intelligence 47.94(全美第 8),Coding 45.57、Agentic 58.22——三项都在 OpenAI 内部排第三,仅次于 5.5 和 5.3 Codex。真正的亮点是上下文:105 万 token,比 5.5 的 25.6 万长了 4 倍,也是目前 OpenAI 全家桶最长。输入 $2.5/M、输出 $15/M,比 5.5 便宜 50%。如果任务不需要极致智能但需要处理长文档,5.4 比 5.5 更合适。

关键指标

AA Intelligence
47.9
AA Coding
45.6
Coding #9
AA Agentic
58.2
Tool/Agent 能力
输出价格
$15.00
/ 百万 token

Artificial Analysis · 独立评测

artificialanalysis.ai · 抓取于 2026-05-12
综合智能(Intelligence Index) 47.94
代码能力(Coding Index) 45.57
Agent 能力(Agentic Index) 58.22
输出速度 71.7 token/s
推理模式 是(reasoning model)

AA 是独立第三方评测站,综合 GPQA / HLE / MMLU-Pro / SciCode / Tau²-Bench / TerminalBench / IFBench 等公开基准。 同一模型不同 reasoning effort 配置 AA 拆开排,本表只取最高分那档。

SuperCLUE · 中文能力测评

未收录:SuperCLUE 3 月榜未收录 GPT-5.4,待后续更新。

API 价格与国内可用性

来源 openrouter.ai · 抓取于 2026-05-12
输入价格 $2.50 / 百万 token
输出价格 $15.00 / 百万 token
上下文窗口 1050K tokens
国内可用性 需代理
最近核验 2026-05-12
同档对手价格
模型 输入 输出 国内
Claude Sonnet 4.6 · Anthropic $3.00 $15.00 需代理
Gemini 3.1 Pro Preview · Google $2.00 $12.00 不稳定
Qwen3.6 Max Preview · Alibaba (阿里云百炼) $1.04 $6.24 可用
Claude Opus 4.7 · Anthropic $5.00 $25.00 需代理

什么时候选它 / 别选它

适合场景
  • 长文档处理——105 万上下文是 OpenAI 全家桶最长
  • 预算敏感但需要 GPT 生态——输出价比 5.5 便宜 50%
  • 多步骤 agent 任务——Agentic Index 58.22,在 OpenAI 内部仅次于 5.5
不适合场景
  • 极致智能场景——比 GPT-5.5 低 12.3 分,差距明显
  • 需要速度——输出 71.7 token/s,比 5.4 Mini 的 179.3 慢很多
  • 国内直连——OpenAI API 没有大陆节点

不选它的话,看看这些