当大模型进入“规模递减收益”阶段,一个更底层的问题开始浮现:模型还能如何持续变强?
MiniMax 最新开源的 M2.7 给出的答案,并不是更大的参数规模,而是一次工程范式的转向——让模型直接参与自身的研发、优化与迭代过程,从而构建“自我进化”的闭环。
对于 AI 技术社区而言,这一尝试的意义,可能不亚于从 GPT-2 到 GPT-3 的跃迁:它触及的是“如何做模型”本身。
传统大模型的开发,本质上是一个以人为中心的流程:
M2.7 引入的变化在于:把模型嵌入到这个流程里。
在实际开发过程中,M2.7 被用于:
结果是,在不依赖额外人工干预的情况下,整体性能提升约 30%。
这意味着一个重要转变:
模型不再只是“被优化的对象”,而是“优化过程的一部分”。
从模型设计来看,M2.7 并未走“极端规模扩张”的路线,而是采用更偏工程化的组合:
这一配置体现了两个核心取舍:
MoE 架构通过动态路由,只激活部分专家网络,使得:
对于 AI 工程来说,这种“算力友好型大模型”更具现实意义。
20 万字级上下文,意味着模型可以:
这类能力,正是当前 AI Agent 系统瓶颈之一。
从评测结果来看,M2.7 并不是一个典型的“通用对话模型”,而更偏向“工程与生产力模型”。
在 SWE-Pro 等评测中表现突出,说明其具备:
这类能力直接服务于 AI 编程 Agent 的核心场景。
在 GDPval-AA 评测中达到 1495 ELO,位列开源模型前列,能够完成:
这意味着其已具备“数字员工”级别的基础能力。
M2.7 的另一个关键特性,是对 Agent 的原生支持,而非外部拼装。
具体表现为:
这使其更接近一个“系统级智能体内核”,而不是单纯的语言模型。
与传统 Agent 框架相比,这种模式将:
M2.7 更深层的价值,在于其探索了一种新的 AI 工程模式:
模型可用于:
这将显著降低大模型研发的边际成本。
通过自动分析失败轨迹,可以实现:
这对当前动辄数周的训练周期尤为关键。
如果模型持续参与自身优化,理论上可以形成:
这种“递归改进”机制,是通往更高阶 AI 的重要路径之一。
M2.7 的开源意义,并不仅在于参数规模或性能指标,而在于其提供了一种可复用的思路:
对于中小团队而言,这意味着:
可以用模型弥补工程与研究资源的不足。
同时,这也可能推动社区关注一个新的核心问题:
过去几年,大模型的进步依赖三大要素:
而 M2.7 所代表的方向,则是在此之外增加了第四个变量:
模型自身的参与度。
对于 AI 技术社区来说,这或许预示着一个重要拐点:
当这种模式成熟,未来的大模型,可能不再只是被“训练”出来的,而是在不断参与自身优化的过程中,逐步演化出来的。