GPT-5.4
OpenAIOpenAI 主力中档,105 万上下文,比 5.5 便宜一半但智能差距不到 20%
发布日期:2026-03-05 · 覆盖数据源:2 / 5 (AA · Pricing)
OpenAI 的「主力档」定位,卡在 5.5 和 5.4 Mini 之间。AA Intelligence 47.94(全美第 8),Coding 45.57、Agentic 58.22——三项都在 OpenAI 内部排第三,仅次于 5.5 和 5.3 Codex。真正的亮点是上下文:105 万 token,比 5.5 的 25.6 万长了 4 倍,也是目前 OpenAI 全家桶最长。输入 $2.5/M、输出 $15/M,比 5.5 便宜 50%。如果任务不需要极致智能但需要处理长文档,5.4 比 5.5 更合适。
关键指标
AA Intelligence
47.9
AA Coding
45.6
Coding #9
AA Agentic
58.2
Tool/Agent 能力
输出价格
$15.00
/ 百万 token
Artificial Analysis · 独立评测
artificialanalysis.ai · 抓取于 2026-05-12| 综合智能(Intelligence Index) | 47.94 |
| 代码能力(Coding Index) | 45.57 |
| Agent 能力(Agentic Index) | 58.22 |
| 输出速度 | 71.7 token/s |
| 推理模式 | 是(reasoning model) |
AA 是独立第三方评测站,综合 GPQA / HLE / MMLU-Pro / SciCode / Tau²-Bench / TerminalBench / IFBench 等公开基准。 同一模型不同 reasoning effort 配置 AA 拆开排,本表只取最高分那档。
SuperCLUE · 中文能力测评
未收录:SuperCLUE 3 月榜未收录 GPT-5.4,待后续更新。
API 价格与国内可用性
来源 openrouter.ai · 抓取于 2026-05-12| 输入价格 | $2.50 / 百万 token |
| 输出价格 | $15.00 / 百万 token |
| 上下文窗口 | 1050K tokens |
| 国内可用性 | 需代理 |
| 最近核验 | 2026-05-12 |
同档对手价格
| 模型 | 输入 | 输出 | 国内 |
|---|---|---|---|
| Claude Sonnet 4.6 · Anthropic | $3.00 | $15.00 | 需代理 |
| Gemini 3.1 Pro Preview · Google | $2.00 | $12.00 | 不稳定 |
| Qwen3.6 Max Preview · Alibaba (阿里云百炼) | $1.04 | $6.24 | 可用 |
| Claude Opus 4.7 · Anthropic | $5.00 | $25.00 | 需代理 |
什么时候选它 / 别选它
适合场景
- 长文档处理——105 万上下文是 OpenAI 全家桶最长
- 预算敏感但需要 GPT 生态——输出价比 5.5 便宜 50%
- 多步骤 agent 任务——Agentic Index 58.22,在 OpenAI 内部仅次于 5.5
不适合场景
- 极致智能场景——比 GPT-5.5 低 12.3 分,差距明显
- 需要速度——输出 71.7 token/s,比 5.4 Mini 的 179.3 慢很多
- 国内直连——OpenAI API 没有大陆节点