从“调参”到“自演化”：MiniMax 开源 M2.7，重塑大模型与 Agent 的工程闭环

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

当大模型进入“规模递减收益”阶段，一个更底层的问题开始浮现：模型还能如何持续变强？

MiniMax 最新开源的 M2.7 给出的答案，并不是更大的参数规模，而是一次工程范式的转向——让模型直接参与自身的研发、优化与迭代过程，从而构建“自我进化”的闭环。

对于 AI 技术社区而言，这一尝试的意义，可能不亚于从 GPT-2 到 GPT-3 的跃迁：它触及的是“如何做模型”本身。

一个关键变化：模型开始参与“造自己”

传统大模型的开发，本质上是一个以人为中心的流程：

研究人员设计训练策略与架构
工程团队实现 pipeline
模型训练 → 评估 → 调整 → 重训

M2.7 引入的变化在于：把模型嵌入到这个流程里。

在实际开发过程中，M2.7 被用于：

自动生成和优化训练相关代码（如数据处理、调度逻辑）
分析失败样本与错误轨迹（failure trajectories）
提出改进方案并参与代码迭代

结果是，在不依赖额外人工干预的情况下，整体性能提升约 30%。

这意味着一个重要转变：

模型不再只是“被优化的对象”，而是“优化过程的一部分”。

架构侧：MoE + 长上下文的实用主义路线

从模型设计来看，M2.7 并未走“极端规模扩张”的路线，而是采用更偏工程化的组合：

总参数：230B
激活参数：10B（稀疏激活）
架构：MoE（Mixture of Experts）
上下文：支持约 20 万字

这一配置体现了两个核心取舍：

稀疏化：控制成本的前提下提升容量

MoE 架构通过动态路由，只激活部分专家网络，使得：

推理成本接近中等规模模型
表达能力接近超大模型
更适合在线服务与高并发场景

对于 AI 工程来说，这种“算力友好型大模型”更具现实意义。

长上下文：面向复杂任务链

20 万字级上下文，意味着模型可以：

处理大型代码库或长文档
在多步骤任务中保留完整上下文
支持 Agent 的长期状态记忆

这类能力，正是当前 AI Agent 系统瓶颈之一。

能力分布：向“工程型模型”倾斜

从评测结果来看，M2.7 并不是一个典型的“通用对话模型”，而更偏向“工程与生产力模型”。

软件工程能力

在 SWE-Pro 等评测中表现突出，说明其具备：

跨文件代码理解
项目级代码生成
Bug 分析与修复

这类能力直接服务于 AI 编程 Agent 的核心场景。

办公自动化能力

在 GDPval-AA 评测中达到 1495 ELO，位列开源模型前列，能够完成：

复杂文档生成与结构化输出
表格数据分析与处理
演示文稿内容自动组织

这意味着其已具备“数字员工”级别的基础能力。

Agent 原生设计：模型即执行系统的一部分

M2.7 的另一个关键特性，是对 Agent 的原生支持，而非外部拼装。

具体表现为：

支持多 Agent 协作（agent team）
能进行任务拆解与分配
具备环境交互能力（tools / APIs）

这使其更接近一个“系统级智能体内核”，而不是单纯的语言模型。

与传统 Agent 框架相比，这种模式将：

一部分 orchestration 逻辑内化进模型
减少外部状态机复杂度
提高整体系统一致性

“自我进化”的工程意义：AI 开始参与 AI 研发

M2.7 更深层的价值，在于其探索了一种新的 AI 工程模式：

自动化研发（AI for AI）

模型可用于：

自动生成实验代码
优化训练策略
分析评测结果

这将显著降低大模型研发的边际成本。

快速反馈闭环

通过自动分析失败轨迹，可以实现：

更快定位问题
更高频迭代
更细粒度优化

这对当前动辄数周的训练周期尤为关键。

潜在的递归提升

如果模型持续参与自身优化，理论上可以形成：

更强模型 → 更优优化能力 → 更强模型

这种“递归改进”机制，是通往更高阶 AI 的重要路径之一。

对开源生态的影响：方法论比权重更重要

M2.7 的开源意义，并不仅在于参数规模或性能指标，而在于其提供了一种可复用的思路：

如何让模型参与工程流程
如何构建自优化 pipeline
如何设计 Agent-native 模型

对于中小团队而言，这意味着：

可以用模型弥补工程与研究资源的不足。

同时，这也可能推动社区关注一个新的核心问题：

不只是“如何训练更大的模型”
而是“如何让模型帮助我们训练模型”

结语：大模型的下一阶段，是“会改进自己”

过去几年，大模型的进步依赖三大要素：

更大规模
更好数据
更强算力

而 M2.7 所代表的方向，则是在此之外增加了第四个变量：

模型自身的参与度。

对于 AI 技术社区来说，这或许预示着一个重要拐点：

模型从工具，变为协作者
从被动产物，变为主动参与者

当这种模式成熟，未来的大模型，可能不再只是被“训练”出来的，而是在不断参与自身优化的过程中，逐步演化出来的。

77 次点击 ∙ 0 人收藏

登录后收藏

0 条回复