事件概述
据 Artificial Analysis 披露,小米 已发布其推理模型 MiMo-V2-Pro。
在其核心评测体系中:
- Intelligence Index 得分:49
- 排名:第 10 位
- 位于 Kimi K2.5 与 GLM-5 之间
此外,在 GDPval-AA 基准中:
- Elo 分数:1426
-
高于:
-
GLM-5
- Kimi K2.5
- Qwen3.5 397B A17B
模型能力与参数特征
从披露信息来看,MiMo-V2-Pro 具备几个关键特征:
1. 超长上下文:100 万 tokens
- 支持 1M tokens 上下文窗口
- 属于当前第一梯队的长上下文能力
这意味着其在以下场景具备优势:
- 长文档分析(代码库 / 法律文本 / 多轮对话)
- 多文件推理(multi-doc reasoning)
- Agent 长链路任务
2. 推理模型定位(Reasoning-first)
MiMo-V2-Pro 被明确定位为“推理模型”,意味着其重点优化:
- 多步推理(multi-step reasoning)
- 复杂任务拆解
- 工具调用能力(潜在)
这类模型通常对标:
3. API-only 策略
目前模型:
这表明其策略更接近:
- 商业闭源服务
- 类似 OpenAI / Anthropic 路线
定价策略:明显的“价格战信号”
MiMo-V2-Pro 的定价如下:
| 场景 |
输入价格 |
输出价格 |
| 标准(≤256K) |
$1 / 1M tokens |
$3 / 1M tokens |
| 长上下文(≥256K) |
$2 / 1M tokens |
$6 / 1M tokens |
关键观察:
- 基础价格极低
在同级推理模型中:
- $1 / $3 已进入“极具竞争力区间”
- 明显低于多数主流推理模型
- 长上下文溢价合理
- 超过 256K token 后价格翻倍
- 反映真实算力成本(KV cache / attention scaling)
- 典型中国厂商打法
这一策略延续了:
“性能接近 + 价格压低”
对标竞品:
- Kimi K2.5
- GLM-5
- Qwen3.5 397B A17B
排名解读:第 10 名意味着什么?
在 Artificial Analysis 的榜单中:
- Top 10 ≠ 顶尖(SOTA)
-
但意味着:
-
已进入“第一梯队尾部”
- 具备实用级推理能力
更重要的是:
其 Elo 超过多款知名模型,说明在特定任务上可能更强。
行业信号:推理模型进入“商品化阶段”
MiMo-V2-Pro 的发布释放出几个重要趋势:
1. 推理能力正在快速“平权”
过去:
现在:
2. 竞争焦点转向“三要素”
未来模型竞争将围绕:
- 性能(benchmark / 实测)
- 成本(token 单价)
- 上下文(context window)
MiMo-V2-Pro 在三者中:
3. API 平台成为主战场
随着不开源趋势增强:
- 模型能力 → API 服务能力
- 开发者锁定 → 平台生态竞争
小米 此举意味着其正在:
从硬件公司 → AI 服务提供商 转型加速
对开发者的建议
如果你是开发者,可以重点关注:
适用场景
- 长文本处理(>200K tokens)
- 成本敏感型应用
- Agent / 自动化流程
风险点
- 未开源(存在平台锁定)
- 生态尚未成熟
- 实测表现可能与 benchmark 存在差异
结语
MiMo-V2-Pro 并不是“最强模型”,但它代表了一种更关键的变化:
推理能力,正在从“稀缺资源”变成“可定价商品”。
当模型性能逐渐趋同时,真正决定胜负的将不再只是技术本身,而是:
而这,才是下一阶段 AI 竞争的核心。