MiniMax 开源 M2.7：从 MoE 到“自我进化”，大模型开始参与自身训练闭环

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

当大模型进入工程化与规模化阶段，一个关键问题逐渐浮现：模型是否可以参与自身的优化过程？

最新开源的 M2.7 模型，正在尝试给出答案。作为一个总参数达 2300 亿、采用 MoE（Mixture of Experts）架构的大模型，M2.7 不仅在性能上刷新开源基准，更重要的是，它在训练与迭代过程中引入了一种新范式——模型参与自身研发流程的“自我进化”机制。

这意味着，大模型正在从“被训练的对象”，转变为“参与训练的主体”。

架构侧：MoE + 长上下文的工程平衡

从基础架构来看，M2.7 延续了当前主流的稀疏化路线：

总参数规模：230B
激活参数：约 10B
架构：Mixture of Experts（MoE）
上下文长度：约 20 万字

这种设计的核心在于计算效率与能力边界的平衡：

MoE 通过路由机制，仅激活部分专家网络，显著降低推理成本
高参数规模保证模型表达能力
超长上下文支持复杂文档处理与跨任务推理

在 Agent 与企业知识处理场景中，这类“高上下文 + 稀疏计算”的组合，正在成为主流配置。

关键突破：模型参与自身优化闭环

相比参数规模，M2.7 更值得关注的是其训练过程中的“自我进化”机制。

据披露，该模型在开发过程中承担了多个角色：

优化内部编程脚手架（coding scaffolding）
分析训练与推理中的失败轨迹（failure trace analysis）
自动生成改进方案并迭代代码

这一过程本质上构建了一个闭环：

模型执行任务或生成代码
系统记录失败路径与性能瓶颈
模型分析问题并提出修改
代码或策略被更新并重新训练

最终，这一机制带来了约 30% 的性能提升。

从机器学习视角看，这种方法接近“self-improving loop”，但不同于传统的 RLHF 或自监督学习，它更偏向工程层面的自举（bootstrapping）。

软件工程能力：从 Benchmark 到真实任务

在评测层面，M2.7 将重点放在“可执行能力”上，而非纯语言理解：

在 SWE-Pro 等软件工程测试中表现突出
能处理多文件、多步骤的代码任务
支持复杂调试与重构场景

这类能力直接对应当前 AI Agent 的核心需求：

不只是生成代码，而是参与完整开发流程
理解上下文依赖与系统结构
在失败后进行迭代修复

换句话说，模型正在从“代码生成器”升级为“工程参与者”。

办公与结构化任务：ELO 排名背后的能力迁移

在更偏应用侧的评测中，M2.7 同样表现激进。

在 GDPval-AA 评估中，其 ELO 分值达到 1495，位居开源模型前列。这一基准更强调模型在复杂办公任务中的表现，例如：

Word 文档结构理解与生成
Excel 数据处理与公式推导
PPT 内容组织与逻辑表达

这些能力的共同点在于：强结构化 + 多步骤推理 + 上下文依赖。

这也解释了为什么长上下文与系统级推理能力成为关键支撑。

原生 Agent 协作：从单体模型到“模型团队”

M2.7 的另一个重要方向，是支持“原生智能体协作”。

与传统单模型调用不同，其设计更接近多 Agent 系统：

不同子任务由不同“角色”处理
模型之间进行信息交换与状态同步
最终结果通过协调机制整合

这类架构在复杂任务中具有明显优势：

降低单模型推理复杂度
提高系统可扩展性
更接近人类团队协作模式

从工程角度看，这也意味着模型能力正在向“系统能力”迁移。

开源意义：从模型发布到方法论输出

此次开源的不只是一个模型，更是一种方法路径：

如何构建 MoE 大模型的工程体系
如何将模型引入研发闭环
如何在 Agent 场景中设计能力结构

对于 AI 社区而言，这类探索具有更长期价值——它不只是提升单点性能，而是在重塑训练与开发范式。

趋势判断：大模型进入“自我进化 + Agent 化”阶段

M2.7 所体现的方向，可以归纳为两个关键词：

1. 自我进化（Self-evolving models）
模型开始参与自身优化，形成持续迭代闭环。

2. Agent 化（Agent-native design）
模型不再孤立运行，而是嵌入多 Agent 系统中协作执行任务。

这两者叠加，可能带来一个重要变化：

未来的大模型，不只是被调用的 API，而是持续演化的“系统组件”。

对于开发者而言，这意味着新的工程挑战：

如何监控模型自我修改的边界
如何验证自动生成优化的可靠性
如何在多 Agent 系统中保持一致性

而对于整个行业来说，这或许标志着一个新的阶段：

大模型，正在从“训练出来”走向“进化出来”。

61 次点击 ∙ 0 人收藏

登录后收藏

0 条回复