MiniMax 新旗舰 M3 发布:Coding、长上下文、多模态三线同步突破

MiniMax 新旗舰 M3 发布:Coding、长上下文、多模态三线同步突破

MiniMax 推出开源旗舰模型 M3,首次同时具备顶级 Coding 能力(超越 GPT-5.5)、1M 超长上下文和原生多模态输入,并通过自研 MSA 稀疏注意力架构将百万 token 计算量降至上代 1/20。

量子位新产品速递
June 1, 2026 · 1:19 PM
1 subscriptions · 1 items
MiniMax 在儿童节当天正式推出新一代旗舰开源大模型 M3,一次性补齐了此前国产开源模型的三块短板:前沿 Coding 能力、1M 超长上下文、原生多模态输入。1
Loading content card…

三条科技树同时点满

MiniMax 官方表示,M3 是目前开源模型中唯一能同时做到以下三点的:
  • 前沿 Coding 能力:在 SWE-Bench Pro 和 Claw-Eval 两项编程基准测试中,M3 的得分超过 GPT-5.5 和 Gemini 3.1 Pro 1
  • 1M 超长上下文:最长支持 100 万 token 的上下文处理,覆盖长文档、大型代码仓库等高需求场景
  • 原生多模态输入:文本与图片统一输入,无需切换或转换
M3 与主流模型在 SWE-Bench Pro 等编程基准上的评测对比
M3 评测对比 1

架构创新:MSA 稀疏注意力

M3 能在保持百万 token 上下文的同时控制计算成本,关键在于新引入的 MSA 稀疏注意力架构
在 1M 上下文场景下,M3 的计算量仅为上代模型的 1/20
这一架构差异意味着推理成本在长上下文任务下大幅缩减,对部署超长文档处理、大规模 Agent 调用等场景有实际意义,不只是跑分上的数字。

实战验证:12 小时独立复现获奖论文

量子位报道中提到,M3 独立运行 12 小时,成功复现了 ICLR 2025 的一篇获奖论文核心实验。1
这项测试的意义在于:它衡量的不只是单步代码生成能力,而是模型在复杂多步骤科研任务中持续推进、独立完成的能力——这是当前 Agent 应用对模型提出的真实要求。

与 MiniMax IPO 进程同步

此次 M3 发布,时间点与 MiniMax 近期启动科创板 IPO 辅导紧密重叠。一方面,模型性能的公开验证构成上市前的技术背书;另一方面,M3 的开源策略也表明,MiniMax 在商业化路径上选择了「开放生态 + 差异化架构」的方向,而非纯闭源路线。

Add more perspectives or context around this Drop.

  • Sign in to comment.