跨境 · 长文档 vs 国内 AA #1
Gemini 3.1 Pro Preview vs Kimi K2.6
TL;DR
做题 Gemini 略高,但 Agentic Kimi 反超 6.9 分 + 国内直连 + 输出便宜 3.4 倍——纯长文档 + 速度选 Gemini,Agent / 国内场景选 Kimi。
关键差异
- AA Intelligence:Gemini (57.18) > Kimi K2.6 (53.90),差 3.3 分
- AA Coding:Gemini (55.50) > Kimi K2.6 (47.12),差 8.4 分
- AA Agentic:Kimi K2.6 (65.97) > Gemini (59.09),Kimi 反超 6.9 分
- 速度:Gemini 129.5 token/s vs Kimi 49.3,Gemini 快 2.6 倍
- 输出价:Gemini $12 vs Kimi $3.49——Gemini 贵 3.4 倍
- 上下文:Gemini 1M vs Kimi K2.6 256K——长文档 Gemini 优势 4 倍
- 国内可用:Gemini 不稳定,Kimi 直连国内
关键指标逐项对比
AA 数据抓取于 2026-05-17 · 价格抓取于 2026-05-19| 指标 | Gemini 3.1 Pro Preview | Kimi K2.6 | 优胜 |
|---|---|---|---|
| AA 综合智能(Intelligence Index) 越高越好 | 57.18 | 53.90 | A |
| AA 代码能力(Coding Index) 越高越好 | 55.50 | 47.12 | A |
| AA Agent 能力(Agentic Index) 越高越好 | 59.09 | 65.97 | B |
| 输入价格($ / 百万 token) 越低越好 | $2.00 | $0.73 | B |
| 输出价格($ / 百万 token) 越低越好 | $12.00 | $3.49 | B |
| 输出速度(token / 秒) 越高越好 | 129.5 | 49.3 | A |
| 上下文窗口 越大越好 | 1049K | 262K | A |
价格差距:Gemini 3.1 Pro Preview 输出价比 Kimi K2.6 贵 3.44 倍($12 vs $3.49)
A = Gemini 3.1 Pro Preview,B = Kimi K2.6。空缺值表示该数据源未收录此模型,不参与优胜判定。
LMArena · 人类盲测各分类
抓取于 2026-05-19| 分类 | Gemini 3.1 Pro Preview | Kimi K2.6 |
|---|---|---|
| 综合对话(Text) | #6 · 1488 | 未进 Top 10 |
| 联网检索(Search) | #6 · 1216 | 未进 Top 10 |
| 前端开发(WebDev) | 未进 Top 10 | #7 · 1519 |
| 视觉理解(Vision) | #10 · 1277 | 未进 Top 10 |
只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。
SuperCLUE · 中文能力测评
2026年3月| 维度 | Gemini 3.1 Pro Preview | Kimi K2.6 |
|---|---|---|
| 收录条目 | Gemini-3.1-Pro-Preview | 未收录 |
| 综合总分 | 76.69 · 榜单 #2 | — |
| 代码生成 | 69.78 | — |
| 数学推理 | 92.44 | — |
| 智能体(任务规划) | 78.96 | — |
| 精确指令遵循 | 56.76 | — |
Kimi K2.6 未收录:SuperCLUE 3 月榜评的是 K2.5(Kimi-K2.5-Thinking,总分 64.6 国内榜第 7),K2.6 4 月才发布。
注意:4月榜延迟发布,截至2026-05-17仍未更新,SuperCLUE 数据可能非最新。
国内可用性 & OpenRouter 用量
Gemini 3.1 Pro Preview
- 国内可用性 不稳定
- OpenRouter 本周 未进 Top 10
- 价格最近核验 2026-05-16
Kimi K2.6
- 国内可用性 可用
- OpenRouter 本周 #8 · 956B
- 价格最近核验 2026-05-16
OpenRouter 用量榜抓取于 2026-05-19,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。
怎么选
选 Gemini 3.1 Pro Preview,如果你:
长文档 RAG(1M 上下文,Kimi K2.6 只有 256K)、速度敏感(129.5 vs Kimi 49.3,快 2.6 倍)、SuperCLUE 海外 #2 中文场景。
选 Kimi K2.6,如果你:
Agent 编排(Agentic 65.97 vs Gemini 59.09,反超 6.9 分)、国内直连不用代理、LMArena WebDev 第 7 的前端能力、性价比敏感。