OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
OA0  ›  社区  ›  MiniMax

MiniMax M2.7:当模型开始“参与训练自己”,Agent 进入自进化阶段

 
  boy ·  2026-03-18 19:35:53 · 4 次点击  · 0 条评论  

MiniMax 最新发布的 M2.7,不只是一次常规模型升级,而是一个更关键的信号:

AI 正在从“被训练”,走向“参与训练自己”


1. 这次发布的核心,不是性能,而是路径

表面看,M2.7 的成绩已经进入第一梯队:

  • SWE-Pro:56.22%(≈ GPT-5.3-Codex)
  • VIBE-Pro:55.6%(≈ Claude Opus 4.6)
  • GDPval-AA:ELO 1495(开源最高)
  • MM-Claw:62.7%(接近 Sonnet 4.6)

但真正关键的不是这些 benchmark,而是:

Agent Harness(Agent 训练闭环)


2. 什么是“模型自我进化”?

传统训练流程是:

1)人类准备数据
2)模型训练
3)人类评估
4)再优化

而 M2.7 的思路是引入 Agent:

1)模型执行任务
2)模型生成中间过程(思考 / 工具调用)
3)模型评估结果
4)模型参与优化数据

一句话总结:

模型开始成为“训练系统的一部分”


3. Agent Harness 在做什么?

可以把它理解为一个“自动化研发系统”:

  • 自动生成训练数据
  • 自动构造任务环境
  • 自动执行与验证
  • 自动反馈优化

这本质上是在解决一个行业难题:

高质量数据不够用

通过 Agent:

  • 数据可以“生成”
  • 错误可以“放大利用”
  • 训练可以“持续循环”

4. 为什么这件事很重要?

因为它改变了 scaling 的方式。

过去:

模型能力 ≈ 数据规模 × 算力

现在开始变成:

模型能力 ≈(数据 × 算力)+ 自进化能力

也就是说:

  • 不只是“喂更多数据”
  • 而是“让模型自己找数据、优化数据”

5. 一个关键指标:30%—50% 工作替代

MiniMax 提到:

在研发场景中,M2.7 可承担 30%—50% 工作量

这其实非常关键,因为:

  • 这不是对话能力
  • 而是“任务完成能力”

意味着模型已经可以:

  • 写代码
  • 调试
  • 调用工具
  • 完成闭环任务

6. OpenRoom:另一个信号

除了模型本身,还开源了:

OpenRoom(Agent 交互系统)

这说明 MiniMax 的目标不只是模型,而是:

  • Agent 运行环境
  • 多 Agent 协作
  • 任务执行框架

换句话说:

模型 + 环境,一起做


7. 对比当前主流路线

可以把当前玩家分成三类:

1)模型派

  • OpenAI
  • Anthropic

核心:更强推理能力


2)Agent 产品派

  • Manus
  • OpenClaw

核心:执行任务


3)自进化系统派(MiniMax)

  • M2.7 + Agent Harness

核心:

让模型自己变强


8. 一个更深层的变化

这件事的本质是:

AI 正在从“静态模型”变成“动态系统”

未来模型可能不再是:

  • 一个固定版本(v1 / v2 / v3)

而是:

  • 持续演化的系统
  • 随环境变化而变化

9. 总结

M2.7 最重要的不是性能追平谁,而是证明了一件事:

模型可以参与构建自己的进化路径

这意味着:

  • 数据瓶颈开始被突破
  • 训练成本结构发生变化
  • Agent 不只是应用层,而是训练层

一句话总结:

下一代模型竞争,不只是“谁更强”,而是“谁进化更快”。

4 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  Ping ·   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor