6月1日,稀宇科技(MiniMax)正式发布新一代大模型MiniMax M3。这个模型的发布时间点耐人寻味——恰好在英伟达GTC台北和微软Build大会的同一天,一家中国AI公司选择用技术实力在全球科技圈的聚光灯下分一杯羹。
核心架构创新:MSA稀疏注意力
MiniMax M3的最大技术亮点是自研的稀疏注意力架构MSA(MiniMax Sparse Attention)。传统Transformer架构的注意力机制是全局密集计算,计算复杂度随序列长度呈二次增长,这导致超长上下文的成本几乎不可承受。MSA通过稀疏化注意力矩阵,在保持模型质量的前提下大幅降低计算开销,使得1M(100万token)超长上下文成为可能。
这不是简单的"加大上下文窗口"——背后是架构层面的创新。目前能同时做到原生多模态+1M上下文+Agent能力的模型,在全球范围内也屈指可数。
三件套齐了:多模态+长上下文+电脑操作
MiniMax M3是国内第一个同时具备以下三种能力的模型,也是目前全球唯一开源的"三件套"模型:
第一,原生多模态——支持图片和视频输入,不是后期拼接的多模态,而是从训练之初就融合了视觉能力。在OmniDocBench多模态测试集上,M3的得分超过Gemini 3.1 Pro。
第二,1M超长上下文——100万token的上下文窗口,意味着你可以一次性输入整本书、整个代码仓库或数小时的会议记录。成本降幅据称达95%。

第三,电脑桌面操作——M3能够直接操作电脑桌面,完成打开应用、点击按钮、输入文本等Agent任务。在Claw-Eval自主Agent评测框架上获得最高分。这一点尤为关键,因为目前DeepSeek还不具备原生多模态及电脑操作能力。
性能对比:部分指标超过GPT-5.5
官方公布的性能数据相当亮眼:SWE-Bench Pro编程能力超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7;SVG-Bench综合评估超过Opus 4.7;Claw-Eval Agent评测获得最高分。
不过,官方跑分和实际表现之间总有差距。社区用户提醒保持审慎,建议参考Linux.do论坛的网友实测。"看今天的股价就知道了"——这句调侃暗示市场对M3的反应可能并未完全印证官方宣称的性能优势。
双模式设计:按需思考
M3支持Thinking和Non-Thinking两种模式,可在请求时按需切换。Thinking模式用于复杂推理、Agentic任务和长程协作;Non-Thinking模式用于对话、代码补全等延迟敏感场景,响应更快。两种模式共享同一套定价,不需要为"思考"额外付费——这一点比OpenAI的o系列厚道。
定价策略:Claude的15倍用量
MiniMax的定价策略可以用"极致性价比"来形容。Plus套餐49元/月6亿token,约为Claude Pro 5倍容量;Max套餐119元/月18亿token,约为Claude Max 5x的2倍;Ultra套餐469元/月55亿token,约为Claude Max 20x的3倍。按相同价格计算,约是Claude订阅的15倍用量。
这种定价策略的背后,是国产大模型在成本端的天然优势——更低的算力成本、更激进的价格战、更快的迭代速度。MiniMax同时也在评估科创板上市,如果成功,将成为继智谱之后第二家登陆A股的大模型公司。
国产大模型的"三件套"时代
MiniMax M3的发布,标志着国产大模型进入了"三件套"竞争阶段——单纯比拼参数量和跑分已经不够了,原生多模态、超长上下文、Agent能力缺一不可。这是从"造模型"到"造工具"的转变——用户需要的不是一个能聊天的AI,而是一个能看图、能读长文、能操作电脑的全能助手。
对MiniMax来说,M3不仅是技术里程碑,更是科创板上市故事的核心素材。一个"三件套齐了"的开源模型,加上15倍性价比的定价——这个故事的杀伤力,远超任何跑分数据。
暂无评论数据
发布
相关推荐
185
0
98
0
524
0
Song老师不是AI
434
0三元桥David
我还没有写个人简介......
帖子
提问
粉丝
黄仁勋COMPUTEX演讲全文解读:Vera Rubin投产、RTX Spark闯入PC、AI Agent时代来了
2026-06-03 10:09:01 发布Meta追踪员工鼠标键盘训练AI遭抵制,被迫让步:可暂停30分钟
2026-06-03 10:07:38 发布
京公网安备:11010502051901号