当大模型进入工程化与规模化阶段,一个关键问题逐渐浮现:模型是否可以参与自身的优化过程?
最新开源的 M2.7 模型,正在尝试给出答案。作为一个总参数达 2300 亿、采用 MoE(Mixture of Experts)架构的大模型,M2.7 不仅在性能上刷新开源基准,更重要的是,它在训练与迭代过程中引入了一种新范式——模型参与自身研发流程的“自我进化”机制。
这意味着,大模型正在从“被训练的对象”,转变为“参与训练的主体”。
从基础架构来看,M2.7 延续了当前主流的稀疏化路线:
这种设计的核心在于计算效率与能力边界的平衡:
在 Agent 与企业知识处理场景中,这类“高上下文 + 稀疏计算”的组合,正在成为主流配置。
相比参数规模,M2.7 更值得关注的是其训练过程中的“自我进化”机制。
据披露,该模型在开发过程中承担了多个角色:
这一过程本质上构建了一个闭环:
最终,这一机制带来了约 30% 的性能提升。
从机器学习视角看,这种方法接近“self-improving loop”,但不同于传统的 RLHF 或自监督学习,它更偏向工程层面的自举(bootstrapping)。
在评测层面,M2.7 将重点放在“可执行能力”上,而非纯语言理解:
这类能力直接对应当前 AI Agent 的核心需求:
换句话说,模型正在从“代码生成器”升级为“工程参与者”。
在更偏应用侧的评测中,M2.7 同样表现激进。
在 GDPval-AA 评估中,其 ELO 分值达到 1495,位居开源模型前列。这一基准更强调模型在复杂办公任务中的表现,例如:
这些能力的共同点在于:强结构化 + 多步骤推理 + 上下文依赖。
这也解释了为什么长上下文与系统级推理能力成为关键支撑。
M2.7 的另一个重要方向,是支持“原生智能体协作”。
与传统单模型调用不同,其设计更接近多 Agent 系统:
这类架构在复杂任务中具有明显优势:
从工程角度看,这也意味着模型能力正在向“系统能力”迁移。
此次开源的不只是一个模型,更是一种方法路径:
对于 AI 社区而言,这类探索具有更长期价值——它不只是提升单点性能,而是在重塑训练与开发范式。
M2.7 所体现的方向,可以归纳为两个关键词:
1. 自我进化(Self-evolving models)
模型开始参与自身优化,形成持续迭代闭环。
2. Agent 化(Agent-native design)
模型不再孤立运行,而是嵌入多 Agent 系统中协作执行任务。
这两者叠加,可能带来一个重要变化:
未来的大模型,不只是被调用的 API,而是持续演化的“系统组件”。
对于开发者而言,这意味着新的工程挑战:
而对于整个行业来说,这或许标志着一个新的阶段:
大模型,正在从“训练出来”走向“进化出来”。