Google 推出Gemini 3.1 Pro，推理能力进一步提升

作者： CBISMB

责任编辑：邹大斌

来源： CBISMB

时间： 2026-02-20 10:18

关键字： AI ，大模型，Gemini

点赞： 367

收藏： 41

如果你想要一个更强大的 AI 模型，或许有理由庆祝。Google 于近期发布 Gemini 3.1 Pro，并将该模型的问世描述为"核心推理能力的一大步"。

从机器学习模型的发布节奏来看，Gemini 3.1 Pro 紧随 Anthropic 和 OpenAI 最近的模型发布之后。几乎还没来得及开始使用新的美国商用 AI 模型，竞争性替代品就已出现。这还不包括来自美国以外的 AI 模型，比如 Qwen3.5。

Google 的 Gemini 团队在一篇博客文章中表示，Gemini 3.1 Pro 在解决复杂问题方面的能力优于前代模型。他们引用了基准测试结果来支持这一说法——不过这些结果应持一定怀疑态度看待。在 ARC-AGI-2 问题解决测试中，Gemini 3.1 Pro 得分为 77.1%，而 Gemini 3 Pro 得分为 31.1%，Gemini 3 Deep Think 得分为 45.1%。

Google 的图表显示，在大多数引用的基准测试中，Gemini 3.1 Pro 的得分超过了竞争对手的商用模型，如 Anthropic 的 Opus 4.6 和 Sonnet 4.6，以及 OpenAI 的 GPT-5.2 和 GPT-5.3-Codex。然而，Opus 4.6 在"人类最后考试"（完整集，测试 + MM）、SWE-Bench Verified 和 τ²-bench 中仍保持最高分。而 GPT-5.3-Codex 在使用 Codex 自己的工具链而非标准 Terminus-2 代理工具链进行评估时，在 SWE-Bench Pro（公开版）和 Terminal-Bench 2.0 中领先。

"3.1 Pro 专为那些简单答案不够用的任务而设计，它将高级推理能力转化为解决你最棘手挑战的实用工具，"Gemini 团队表示。"这种增强的智能可以帮助实际应用——无论你是想要对复杂主题进行清晰的可视化解释，还是希望将数据综合为单一视图，或是让创意项目变为现实。"

为了说明潜在用途，Gemini 团队指出该模型可以创建适用于网站的 SVG 动画，并能将小说的文学风格转化为个人作品集网站的设计。

在公司 2025 年第四季度财报发布 [PDF] 中，首席执行官 Sundar Pichai 表示："我们的第一方模型（如 Gemini）现在通过客户的直接 API 使用，每分钟处理超过 100 亿个 token，Gemini 应用的月活跃用户已增长至超过 7.5 亿。"

Google 正通过 Google AI Studio 中的 Gemini API、Gemini CLI、Antigravity 和 Android Studio 提供 Gemini 3.1 Pro。企业客户可通过 Vertex AI 和 Gemini Enterprise 访问，而消费者可通过 Gemini 应用和 NotebookLM 访问。

该模型还可通过多项 Microsoft 服务访问，包括 GitHub Copilot、Visual Studio 和 Visual Studio Code。

©本站发布的所有内容，包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等，除特别标明外，均来源于网络或用户投稿，版权归原作者或原出处所有。我们致力于保护原作者版权，若涉及版权问题，请及时联系我们进行处理。

Google 推出Gemini 3.1 Pro，推理能力进一步提升

相关推荐

智库专家

解决方案