MiniMax M3发布：百万上下文+原生多模态+电脑操作，国产模型三件套齐了

三元桥David 2026-06-03 10:13:33 发布

0 浏览 0 点赞 0 收藏

6月1日，稀宇科技（MiniMax）正式发布新一代大模型MiniMax M3。这个模型的发布时间点耐人寻味——恰好在英伟达GTC台北和微软Build大会的同一天，一家中国AI公司选择用技术实力在全球科技圈的聚光灯下分一杯羹。

核心架构创新：MSA稀疏注意力

MiniMax M3的最大技术亮点是自研的稀疏注意力架构MSA（MiniMax Sparse Attention）。传统Transformer架构的注意力机制是全局密集计算，计算复杂度随序列长度呈二次增长，这导致超长上下文的成本几乎不可承受。MSA通过稀疏化注意力矩阵，在保持模型质量的前提下大幅降低计算开销，使得1M（100万token）超长上下文成为可能。

这不是简单的"加大上下文窗口"——背后是架构层面的创新。目前能同时做到原生多模态+1M上下文+Agent能力的模型，在全球范围内也屈指可数。

三件套齐了：多模态+长上下文+电脑操作

MiniMax M3是国内第一个同时具备以下三种能力的模型，也是目前全球唯一开源的"三件套"模型：

第一，原生多模态——支持图片和视频输入，不是后期拼接的多模态，而是从训练之初就融合了视觉能力。在OmniDocBench多模态测试集上，M3的得分超过Gemini 3.1 Pro。

第二，1M超长上下文——100万token的上下文窗口，意味着你可以一次性输入整本书、整个代码仓库或数小时的会议记录。成本降幅据称达95%。

MiniMax M3国产模型

第三，电脑桌面操作——M3能够直接操作电脑桌面，完成打开应用、点击按钮、输入文本等Agent任务。在Claw-Eval自主Agent评测框架上获得最高分。这一点尤为关键，因为目前DeepSeek还不具备原生多模态及电脑操作能力。

性能对比：部分指标超过GPT-5.5

官方公布的性能数据相当亮眼：SWE-Bench Pro编程能力超过GPT-5.5和Gemini 3.1 Pro，接近Opus 4.7；SVG-Bench综合评估超过Opus 4.7；Claw-Eval Agent评测获得最高分。

不过，官方跑分和实际表现之间总有差距。社区用户提醒保持审慎，建议参考Linux.do论坛的网友实测。"看今天的股价就知道了"——这句调侃暗示市场对M3的反应可能并未完全印证官方宣称的性能优势。

双模式设计：按需思考

M3支持Thinking和Non-Thinking两种模式，可在请求时按需切换。Thinking模式用于复杂推理、Agentic任务和长程协作；Non-Thinking模式用于对话、代码补全等延迟敏感场景，响应更快。两种模式共享同一套定价，不需要为"思考"额外付费——这一点比OpenAI的o系列厚道。

定价策略：Claude的15倍用量

MiniMax的定价策略可以用"极致性价比"来形容。Plus套餐49元/月6亿token，约为Claude Pro 5倍容量；Max套餐119元/月18亿token，约为Claude Max 5x的2倍；Ultra套餐469元/月55亿token，约为Claude Max 20x的3倍。按相同价格计算，约是Claude订阅的15倍用量。

这种定价策略的背后，是国产大模型在成本端的天然优势——更低的算力成本、更激进的价格战、更快的迭代速度。MiniMax同时也在评估科创板上市，如果成功，将成为继智谱之后第二家登陆A股的大模型公司。

国产大模型的"三件套"时代

MiniMax M3的发布，标志着国产大模型进入了"三件套"竞争阶段——单纯比拼参数量和跑分已经不够了，原生多模态、超长上下文、Agent能力缺一不可。这是从"造模型"到"造工具"的转变——用户需要的不是一个能聊天的AI，而是一个能看图、能读长文、能操作电脑的全能助手。

对MiniMax来说，M3不仅是技术里程碑，更是科创板上市故事的核心素材。一个"三件套齐了"的开源模型，加上15倍性价比的定价——这个故事的杀伤力，远超任何跑分数据。

©本站发布的所有内容，包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等，除特别标明外，均来源于网络或用户投稿，版权归原作者或原出处所有。我们致力于保护原作者版权，若涉及版权问题，请及时联系我们进行处理。

分类

业界新闻

暂无评论数据

加载中...

发布

相关推荐