LLMRank 中文 LLM 综合参考

国际线 · 主力对决

Claude Sonnet 4.6 vs Gemini 3.1 Pro Preview

Claude Sonnet 4.6

国际线性价比最高的旗舰，开发者真金白银投票出来的主力

覆盖数据源 4 / 5

Gemini 3.1 Pro Preview

百万上下文加便宜价格，长文档场景的国际线首选

覆盖数据源 4 / 5

TL;DR

智能分 Gemini 高 5.5 分 + 便宜 20%，但 Sonnet 4.6 在前端 WebDev 强、OpenRouter 用量主力。

关键差异

AA Intelligence：Gemini 3.1 Pro (57.18) > Sonnet 4.6 (51.71)，差 5.5 分
输出价格：Gemini $12 vs Sonnet $15，相差不大
LMArena WebDev：Sonnet 4.6 第 6，Gemini 3.1 Pro 没进 Top 10
速度：Gemini 129.5 token/s vs Sonnet 56.6 token/s，Gemini 快 2.3 倍

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-12

指标	Claude Sonnet 4.6	Gemini 3.1 Pro Preview	优胜
AA 综合智能（Intelligence Index）越高越好	51.72	57.18	B
AA 代码能力（Coding Index）越高越好	50.94	55.50	B
AA Agent 能力（Agentic Index）越高越好	63.00	59.09	A
输入价格（$ / 百万 token）越低越好	$3.00	$2.00	B
输出价格（$ / 百万 token）越低越好	$15.00	$12.00	B
输出速度（token / 秒）越高越好	51	129.5	B
上下文窗口越大越好	1000K	1049K	B

价格差距：Claude Sonnet 4.6 输出价比 Gemini 3.1 Pro Preview 贵 1.25 倍（$15 vs $12）

A = Claude Sonnet 4.6，B = Gemini 3.1 Pro Preview。空缺值表示该数据源未收录此模型，不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12

分类	Claude Sonnet 4.6	Gemini 3.1 Pro Preview
综合对话（Text）	未进 Top 10	#4 · 1492
联网检索（Search）	#5 · 1221	#6 · 1217
前端开发（WebDev）	#6 · 1524	未进 Top 10
视觉理解（Vision）	未进 Top 10	#10 · 1277

只显示 Top 10 内出现的分类。同一模型不同变体（thinking / search 等）取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

SuperCLUE · 中文能力测评

2026年3月

维度	Claude Sonnet 4.6	Gemini 3.1 Pro Preview
收录条目	未收录	Gemini-3.1-Pro-Preview
综合总分	—	76.69 · 榜单 #2
代码生成	—	69.78
数学推理	—	92.44
智能体(任务规划)	—	78.96
精确指令遵循	—	56.76

Claude Sonnet 4.6 未收录：SuperCLUE 3 月榜里没有 Sonnet 4.6 单独条目（只评了 Opus 4.6）。

国内可用性 & OpenRouter 用量

Claude Sonnet 4.6

国内可用性需代理
OpenRouter 本周 #3 · 1.49T
价格最近核验 2026-05-12

Gemini 3.1 Pro Preview

国内可用性不稳定
OpenRouter 本周未进 Top 10
价格最近核验 2026-05-12

OpenRouter 用量榜抓取于 2026-05-12，反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首，参考时注意是「跑量」而不是「能力」。

怎么选

选 Claude Sonnet 4.6，如果你：

前端 React/Vue 组件生成、Cursor/Cline 已用主力、长上下文 + 工具调用频繁的 agent。

选 Gemini 3.1 Pro Preview，如果你：

智能分至上、便宜一档、对响应速度敏感、需要 SuperCLUE 海外榜第 2 的中文场景。

还在比的其他对

同家族升级

Claude Opus 4.7 vs Claude Sonnet 4.6

国际线 · 主力 vs 旗舰

Claude Sonnet 4.6 vs GPT-5.5

跨境 · 国际主力 vs 国内旗舰

Claude Sonnet 4.6 vs DeepSeek V4 Pro

国际线 · 顶级 vs 长文档之王

Claude Opus 4.7 vs Gemini 3.1 Pro Preview

国际线 · 长文档 vs 做题

Gemini 3.1 Pro Preview vs GPT-5.5

← 看所有对比回模型库 →