国际线 · 轻量档对决
Gemini 3 Flash Preview vs GPT-5.4 Mini
TL;DR
GPT-5.4 Mini 品牌认知强但上下文只有 128K,Gemini 3 Flash 1M 上下文 + 速度快 + 便宜 33%——长文档选 Gemini,通用选 GPT。
关键差异
- 上下文窗口:Gemini 3 Flash 1M vs GPT-5.4 Mini 128K——8 倍差距
- 输出价:Gemini $3.00 vs GPT-5.4 Mini $4.50,Gemini 便宜 33%
- 国内可用性:两者都需代理,Gemini 偶尔能裸连(极不稳定)
- AA 数据:两者均未入 AA Top 12(估 Intelligence 45-48 区间)
关键指标逐项对比
AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-14| 指标 | Gemini 3 Flash Preview | GPT-5.4 Mini | 优胜 |
|---|---|---|---|
| AA 综合智能(Intelligence Index) 越高越好 | 46.43 | 48.90 | B |
| AA 代码能力(Coding Index) 越高越好 | 42.62 | 51.48 | B |
| AA Agent 能力(Agentic Index) 越高越好 | 49.66 | 58.88 | B |
| 输入价格($ / 百万 token) 越低越好 | $0.50 | $0.75 | A |
| 输出价格($ / 百万 token) 越低越好 | $3.00 | $4.50 | A |
| 输出速度(token / 秒) 越高越好 | 182 | 179.3 | A |
| 上下文窗口 越大越好 | 1049K | 400K | A |
价格差距:GPT-5.4 Mini 输出价比 Gemini 3 Flash Preview 贵 1.50 倍($4.5 vs $3)
A = Gemini 3 Flash Preview,B = GPT-5.4 Mini。空缺值表示该数据源未收录此模型,不参与优胜判定。
LMArena · 人类盲测各分类
抓取于 2026-05-12| 分类 | Gemini 3 Flash Preview | GPT-5.4 Mini |
|---|---|---|
| 联网检索(Search) | #9 · 1209 | 未进 Top 10 |
只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。
国内可用性 & OpenRouter 用量
Gemini 3 Flash Preview
- 国内可用性 不稳定
- OpenRouter 本周 未进 Top 10
- 价格最近核验 2026-05-12
GPT-5.4 Mini
- 国内可用性 需代理
- OpenRouter 本周 未进 Top 10
- 价格最近核验 2026-05-12
OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。
怎么选
选 Gemini 3 Flash Preview,如果你:
长文档 RAG(1M 上下文)、对速度敏感(Google 速度旗舰)、预算更紧(输出 $3 vs $4.5)。
选 GPT-5.4 Mini,如果你:
OpenAI 生态(function calling 兼容最好)、通用轻量任务、品牌/社区生态优先。