国内线 · DeepSeek vs 小米黑马
DeepSeek V4 Pro vs MiMo-V2.5-Pro
TL;DR
MiMo AA 智能/Agent 略高,DeepSeek SuperCLUE 国内 #2 + 价格略便宜 + 开源——MiMo 用 AA 数据更亮眼,DeepSeek 用中文榜更稳。
关键差异
- AA Intelligence:MiMo (53.83) > V4 Pro (51.51),差 2.3 分
- AA Agentic:MiMo (67.44) > V4 Pro (67.19),几乎打平
- 输出价:MiMo $3 vs V4 Pro $3.48,MiMo 便宜 14%
- SuperCLUE:V4 Pro 国内 #2 (70.98) > MiMo 上一代 #13 (60.67),中文榜 DeepSeek 强一档
关键指标逐项对比
AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-12| 指标 | DeepSeek V4 Pro | MiMo-V2.5-Pro | 优胜 |
|---|---|---|---|
| AA 综合智能(Intelligence Index) 越高越好 | 51.51 | 53.83 | B |
| AA 代码能力(Coding Index) 越高越好 | 47.47 | 45.53 | A |
| AA Agent 能力(Agentic Index) 越高越好 | 67.19 | 67.44 | B |
| 输入价格($ / 百万 token) 越低越好 | $0.43 | $1.00 | A |
| 输出价格($ / 百万 token) 越低越好 | $0.87 | $3.00 | A |
| 输出速度(token / 秒) 越高越好 | 30.1 | 57.4 | B |
| 上下文窗口 越大越好 | 1049K | 1049K | ≈ |
价格差距:MiMo-V2.5-Pro 输出价比 DeepSeek V4 Pro 贵 3.45 倍($3 vs $0.87)
A = DeepSeek V4 Pro,B = MiMo-V2.5-Pro。空缺值表示该数据源未收录此模型,不参与优胜判定。
SuperCLUE · 中文能力测评
2026年3月| 维度 | DeepSeek V4 Pro | MiMo-V2.5-Pro |
|---|---|---|
| 收录条目 | DeepSeek-V4-Pro | 未收录 |
| 综合总分 | 70.98 · 榜单 #5 | — |
| 代码生成 | 63.24 | — |
| 数学推理 | 87.39 | — |
| 智能体(任务规划) | 77.49 | — |
| 精确指令遵循 | 37.84 | — |
MiMo-V2.5-Pro 未收录:SuperCLUE 3 月榜里是上一代 MiMo-V2-Pro(总分 60.67 国内榜第 13),2.5 是 4 月升级版。
国内可用性 & OpenRouter 用量
DeepSeek V4 Pro
- 国内可用性 可用
- OpenRouter 本周 #9 · 845B
- 价格最近核验 2026-05-12
MiMo-V2.5-Pro
- 国内可用性 可用
- OpenRouter 本周 未进 Top 10
- 价格最近核验 2026-05-12
OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。
怎么选
选 DeepSeek V4 Pro,如果你:
中文写作场景(SuperCLUE 国内 #2 vs MiMo 上一代国内 #13)、私有化部署(开源)、性价比(输出 $3.48 vs MiMo $3,几乎同价但 DeepSeek 略贵一点)。
选 MiMo-V2.5-Pro,如果你:
AA 数据为准的开发场景(智能/Agent 都略高)、Agent 任务最强(Agentic 67.44)、小米生态。