跨境 · 长文档 vs 国内 AA #1

Gemini 3.1 Pro Preview vs Kimi K2.6

TL;DR

做题 Gemini 略高,但 Agentic Kimi 反超 6.9 分 + 国内直连 + 输出便宜 3.4 倍——纯长文档 + 速度选 Gemini,Agent / 国内场景选 Kimi。

关键差异

  • AA Intelligence:Gemini (57.18) > Kimi K2.6 (53.90),差 3.3 分
  • AA Coding:Gemini (55.50) > Kimi K2.6 (47.12),差 8.4 分
  • AA Agentic:Kimi K2.6 (65.97) > Gemini (59.09),Kimi 反超 6.9 分
  • 速度:Gemini 129.5 token/s vs Kimi 49.3,Gemini 快 2.6 倍
  • 输出价:Gemini $12 vs Kimi $3.49——Gemini 贵 3.4 倍
  • 上下文:Gemini 1M vs Kimi K2.6 256K——长文档 Gemini 优势 4 倍
  • 国内可用:Gemini 不稳定,Kimi 直连国内

关键指标逐项对比

AA 数据抓取于 2026-05-17 · 价格抓取于 2026-05-19
指标 Gemini 3.1 Pro Preview Kimi K2.6 优胜
AA 综合智能(Intelligence Index) 越高越好 57.18 53.90 A
AA 代码能力(Coding Index) 越高越好 55.50 47.12 A
AA Agent 能力(Agentic Index) 越高越好 59.09 65.97 B
输入价格($ / 百万 token) 越低越好 $2.00 $0.73 B
输出价格($ / 百万 token) 越低越好 $12.00 $3.49 B
输出速度(token / 秒) 越高越好 129.5 49.3 A
上下文窗口 越大越好 1049K 262K A

价格差距:Gemini 3.1 Pro Preview 输出价比 Kimi K2.6 贵 3.44 倍($12 vs $3.49)

A = Gemini 3.1 Pro Preview,B = Kimi K2.6。空缺值表示该数据源未收录此模型,不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-19
分类 Gemini 3.1 Pro Preview Kimi K2.6
综合对话(Text) #6 · 1488 未进 Top 10
联网检索(Search) #6 · 1216 未进 Top 10
前端开发(WebDev) 未进 Top 10 #7 · 1519
视觉理解(Vision) #10 · 1277 未进 Top 10

只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

SuperCLUE · 中文能力测评

2026年3月
维度 Gemini 3.1 Pro Preview Kimi K2.6
收录条目 Gemini-3.1-Pro-Preview 未收录
综合总分 76.69 · 榜单 #2
代码生成 69.78
数学推理 92.44
智能体(任务规划) 78.96
精确指令遵循 56.76

Kimi K2.6 未收录:SuperCLUE 3 月榜评的是 K2.5(Kimi-K2.5-Thinking,总分 64.6 国内榜第 7),K2.6 4 月才发布。

注意:4月榜延迟发布,截至2026-05-17仍未更新,SuperCLUE 数据可能非最新。

国内可用性 & OpenRouter 用量

Gemini 3.1 Pro Preview
  • 国内可用性 不稳定
  • OpenRouter 本周 未进 Top 10
  • 价格最近核验 2026-05-16
Kimi K2.6
  • 国内可用性 可用
  • OpenRouter 本周 #8 · 956B
  • 价格最近核验 2026-05-16

OpenRouter 用量榜抓取于 2026-05-19,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。

怎么选

Gemini 3.1 Pro Preview,如果你:

长文档 RAG(1M 上下文,Kimi K2.6 只有 256K)、速度敏感(129.5 vs Kimi 49.3,快 2.6 倍)、SuperCLUE 海外 #2 中文场景。

Kimi K2.6,如果你:

Agent 编排(Agentic 65.97 vs Gemini 59.09,反超 6.9 分)、国内直连不用代理、LMArena WebDev 第 7 的前端能力、性价比敏感。

还在比的其他对