Google 推出Gemini 3.1 Pro,推理能力进一步提升

作者: CBISMB

责任编辑: 邹大斌

来源: CBISMB

时间: 2026-02-20 10:18

关键字: Gemini,大模型,AI

浏览: 0

点赞: 0

收藏: 0

如果你想要一个更强大的 AI 模型,或许有理由庆祝。Google 于近期发布 Gemini 3.1 Pro,并将该模型的问世描述为"核心推理能力的一大步"。

从机器学习模型的发布节奏来看,Gemini 3.1 Pro 紧随 Anthropic 和 OpenAI 最近的模型发布之后。几乎还没来得及开始使用新的美国商用 AI 模型,竞争性替代品就已出现。这还不包括来自美国以外的 AI 模型,比如 Qwen3.5。

Google 的 Gemini 团队在一篇博客文章中表示,Gemini 3.1 Pro 在解决复杂问题方面的能力优于前代模型。他们引用了基准测试结果来支持这一说法——不过这些结果应持一定怀疑态度看待。在 ARC-AGI-2 问题解决测试中,Gemini 3.1 Pro 得分为 77.1%,而 Gemini 3 Pro 得分为 31.1%,Gemini 3 Deep Think 得分为 45.1%。

Google 的图表显示,在大多数引用的基准测试中,Gemini 3.1 Pro 的得分超过了竞争对手的商用模型,如 Anthropic 的 Opus 4.6 和 Sonnet 4.6,以及 OpenAI 的 GPT-5.2 和 GPT-5.3-Codex。然而,Opus 4.6 在"人类最后考试"(完整集,测试 + MM)、SWE-Bench Verified 和 τ²-bench 中仍保持最高分。而 GPT-5.3-Codex 在使用 Codex 自己的工具链而非标准 Terminus-2 代理工具链进行评估时,在 SWE-Bench Pro(公开版)和 Terminal-Bench 2.0 中领先。

"3.1 Pro 专为那些简单答案不够用的任务而设计,它将高级推理能力转化为解决你最棘手挑战的实用工具,"Gemini 团队表示。"这种增强的智能可以帮助实际应用——无论你是想要对复杂主题进行清晰的可视化解释,还是希望将数据综合为单一视图,或是让创意项目变为现实。"

为了说明潜在用途,Gemini 团队指出该模型可以创建适用于网站的 SVG 动画,并能将小说的文学风格转化为个人作品集网站的设计。

在公司 2025 年第四季度财报发布 [PDF] 中,首席执行官 Sundar Pichai 表示:"我们的第一方模型(如 Gemini)现在通过客户的直接 API 使用,每分钟处理超过 100 亿个 token,Gemini 应用的月活跃用户已增长至超过 7.5 亿。"

Google 正通过 Google AI Studio 中的 Gemini API、Gemini CLI、Antigravity 和 Android Studio 提供 Gemini 3.1 Pro。企业客户可通过 Vertex AI 和 Gemini Enterprise 访问,而消费者可通过 Gemini 应用和 NotebookLM 访问。

该模型还可通过多项 Microsoft 服务访问,包括 GitHub Copilot、Visual Studio 和 Visual Studio Code。

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。