国际线 · 主力对决

Claude Sonnet 4.6 vs Gemini 3.1 Pro Preview

TL;DR

智能分 Gemini 高 5.5 分 + 便宜 20%,但 Sonnet 4.6 在前端 WebDev 强、OpenRouter 用量主力。

关键差异

  • AA Intelligence:Gemini 3.1 Pro (57.18) > Sonnet 4.6 (51.71),差 5.5 分
  • 输出价格:Gemini $12 vs Sonnet $15,相差不大
  • LMArena WebDev:Sonnet 4.6 第 6,Gemini 3.1 Pro 没进 Top 10
  • 速度:Gemini 129.5 token/s vs Sonnet 56.6 token/s,Gemini 快 2.3 倍

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-12
指标 Claude Sonnet 4.6 Gemini 3.1 Pro Preview 优胜
AA 综合智能(Intelligence Index) 越高越好 51.72 57.18 B
AA 代码能力(Coding Index) 越高越好 50.94 55.50 B
AA Agent 能力(Agentic Index) 越高越好 63.00 59.09 A
输入价格($ / 百万 token) 越低越好 $3.00 $2.00 B
输出价格($ / 百万 token) 越低越好 $15.00 $12.00 B
输出速度(token / 秒) 越高越好 51 129.5 B
上下文窗口 越大越好 1000K 1049K B

价格差距:Claude Sonnet 4.6 输出价比 Gemini 3.1 Pro Preview 贵 1.25 倍($15 vs $12)

A = Claude Sonnet 4.6,B = Gemini 3.1 Pro Preview。空缺值表示该数据源未收录此模型,不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12
分类 Claude Sonnet 4.6 Gemini 3.1 Pro Preview
综合对话(Text) 未进 Top 10 #4 · 1492
联网检索(Search) #5 · 1221 #6 · 1217
前端开发(WebDev) #6 · 1524 未进 Top 10
视觉理解(Vision) 未进 Top 10 #10 · 1277

只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

SuperCLUE · 中文能力测评

2026年3月
维度 Claude Sonnet 4.6 Gemini 3.1 Pro Preview
收录条目 未收录 Gemini-3.1-Pro-Preview
综合总分 76.69 · 榜单 #2
代码生成 69.78
数学推理 92.44
智能体(任务规划) 78.96
精确指令遵循 56.76

Claude Sonnet 4.6 未收录:SuperCLUE 3 月榜里没有 Sonnet 4.6 单独条目(只评了 Opus 4.6)。

国内可用性 & OpenRouter 用量

Claude Sonnet 4.6
  • 国内可用性 需代理
  • OpenRouter 本周 #3 · 1.49T
  • 价格最近核验 2026-05-12
Gemini 3.1 Pro Preview
  • 国内可用性 不稳定
  • OpenRouter 本周 未进 Top 10
  • 价格最近核验 2026-05-12

OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。

怎么选

Claude Sonnet 4.6,如果你:

前端 React/Vue 组件生成、Cursor/Cline 已用主力、长上下文 + 工具调用频繁的 agent。

Gemini 3.1 Pro Preview,如果你:

智能分至上、便宜一档、对响应速度敏感、需要 SuperCLUE 海外榜第 2 的中文场景。

还在比的其他对