MiniMax M2.7：当模型开始“参与训练自己”，Agent 进入自进化阶段

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

MiniMax 最新发布的 M2.7，不只是一次常规模型升级，而是一个更关键的信号：

AI 正在从“被训练”，走向“参与训练自己”

1. 这次发布的核心，不是性能，而是路径

表面看，M2.7 的成绩已经进入第一梯队：

SWE-Pro：56.22%（≈ GPT-5.3-Codex）
VIBE-Pro：55.6%（≈ Claude Opus 4.6）
GDPval-AA：ELO 1495（开源最高）
MM-Claw：62.7%（接近 Sonnet 4.6）

但真正关键的不是这些 benchmark，而是：

Agent Harness（Agent 训练闭环）

2. 什么是“模型自我进化”？

传统训练流程是：

1）人类准备数据
2）模型训练
3）人类评估
4）再优化

而 M2.7 的思路是引入 Agent：

1）模型执行任务
2）模型生成中间过程（思考 / 工具调用）
3）模型评估结果
4）模型参与优化数据

一句话总结：

模型开始成为“训练系统的一部分”

3. Agent Harness 在做什么？

可以把它理解为一个“自动化研发系统”：

自动生成训练数据
自动构造任务环境
自动执行与验证
自动反馈优化

这本质上是在解决一个行业难题：

高质量数据不够用

通过 Agent：

数据可以“生成”
错误可以“放大利用”
训练可以“持续循环”

4. 为什么这件事很重要？

因为它改变了 scaling 的方式。

过去：

模型能力 ≈ 数据规模 × 算力

现在开始变成：

模型能力 ≈（数据 × 算力）+ 自进化能力

也就是说：

不只是“喂更多数据”
而是“让模型自己找数据、优化数据”

5. 一个关键指标：30%—50% 工作替代

MiniMax 提到：

在研发场景中，M2.7 可承担 30%—50% 工作量

这其实非常关键，因为：

这不是对话能力
而是“任务完成能力”

意味着模型已经可以：

写代码
调试
调用工具
完成闭环任务

6. OpenRoom：另一个信号

除了模型本身，还开源了：

OpenRoom（Agent 交互系统）

这说明 MiniMax 的目标不只是模型，而是：

Agent 运行环境
多 Agent 协作
任务执行框架

换句话说：

模型 + 环境，一起做

7. 对比当前主流路线

可以把当前玩家分成三类：

1）模型派

OpenAI
Anthropic

核心：更强推理能力

2）Agent 产品派

Manus
OpenClaw

核心：执行任务

3）自进化系统派（MiniMax）

M2.7 + Agent Harness

核心：

让模型自己变强

8. 一个更深层的变化

这件事的本质是：

AI 正在从“静态模型”变成“动态系统”

未来模型可能不再是：

一个固定版本（v1 / v2 / v3）

而是：

持续演化的系统
随环境变化而变化

9. 总结

M2.7 最重要的不是性能追平谁，而是证明了一件事：

模型可以参与构建自己的进化路径

这意味着：

数据瓶颈开始被突破
训练成本结构发生变化
Agent 不只是应用层，而是训练层

一句话总结：

下一代模型竞争，不只是“谁更强”，而是“谁进化更快”。

76 次点击 ∙ 0 人收藏

登录后收藏

0 条回复