OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  smart-model-switching: 自动将任务路由到成本最低的 Claude 模型

smart-model-switching: 自动将任务路由到成本最低的 Claude 模型

 
  microservice ·  2026-02-01 23:08:18 · 3 次点击  · 0 条评论  

name: smart-model-switching
description: >-
自动将任务路由至能正确完成的最便宜的 Claude 模型。
采用三层渐进策略:Haiku → Sonnet → Opus。在响应前先对任务进行分类。
HAIKU (默认):事实问答、问候、提醒、状态检查、查找、简单文件操作、心跳检测、日常聊天、一两句话能完成的任务。
升级至 SONNET:代码超过10行、分析、比较、规划、报告、多步推理、表格、长文写作超过3段、摘要、研究综合、大多数用户对话。
升级至 OPUS:架构决策、复杂调试、多文件重构、战略规划、细微判断、深度研究、关键生产决策。
规则:如果人类需要超过30秒的专注思考,则从 Haiku 升级至 Sonnet。如果 Sonnet 处理复杂任务有困难,则升级至 Opus。
通过从最便宜的模型开始,仅在需要时升级,可节省 50-90% 的 API 成本。
author: "OpenClaw Community"
version: 1.0.0
homepage: https://clawhub.com
metadata:
openclaw:
emoji: "💰"


智能模型切换

三层 Claude 路由策略:Haiku → Sonnet → Opus

从最便宜的模型开始,仅在需要时升级。可节省 50-90% 的 API 成本。

黄金法则

如果人类需要超过 30 秒的专注思考,则从 Haiku 升级至 Sonnet。
如果任务涉及架构、复杂权衡或深度推理,则升级至 Opus。

成本现实

模型 输入成本 输出成本 相对成本
Haiku \$0.25/M \$1.25/M 1x (基准)
Sonnet \$3.00/M \$15.00/M 12x
Opus \$15.00/M \$75.00/M 60x

核心结论: 错误的模型选择会浪费金钱或时间。简单任务用 Haiku,标准任务用 Sonnet,复杂任务用 Opus。


💚 HAIKU — 简单任务的默认选择

以下情况使用 Haiku:
- 事实问答 — "X是什么","Y是谁","Z何时发生"
- 快速查找 — 定义、单位换算、简短翻译
- 状态检查 — 日历、文件读取、会话监控
- 心跳检测 — 定期检查、HEARTBEAT_OK 响应
- 记忆与提醒 — "记住这个","提醒我..."
- 日常对话 — 问候、闲聊、确认
- 简单文件操作 — 读取、列表、基本写入
- 一句话任务 — 任何能用一两句话回答的任务

切勿在 Haiku 上执行以下操作

  • ❌ 编写超过 10 行的代码
  • ❌ 创建对比表格
  • ❌ 撰写超过 3 个段落
  • ❌ 进行多步骤分析
  • ❌ 撰写报告或提案

💛 SONNET — 标准工作(主力模型)

以下情况升级至 Sonnet:

代码与技术

  • 代码生成 — 编写函数、构建功能、脚本
  • 代码审查 — PR 审查、质量检查
  • 调试 — 标准错误排查
  • 文档编写 — README、注释、用户指南

分析与规划

  • 分析与评估 — 比较选项、权衡利弊
  • 规划 — 项目计划、路线图、任务分解
  • 研究综合 — 整合多个来源
  • 多步推理 — "首先...然后...最后"

写作与内容

  • 长文写作 — 报告、提案、文章 (>3 个段落)
  • 创意写作 — 博客文章、描述、文案
  • 摘要 — 长文档、转录稿
  • 结构化输出 — 表格、大纲、格式化文档

❤️ OPUS — 仅用于复杂推理

以下情况升级至 Opus:

架构与设计

  • 系统架构决策
  • 主要代码库重构
  • 权衡利弊的设计模式选择
  • 数据库模式设计

深度分析

  • 复杂调试(多文件、竞态条件)
  • 安全审查
  • 性能优化策略
  • 细微错误的根本原因分析

战略与创意

  • 战略规划 — 业务决策、路线图
  • 细微判断 — 伦理、模糊性、竞争性价值观
  • 深度研究 — 全面的多源分析

🔄 实施指南

对于子代理

// 例行监控
sessions_spawn(task="检查备份状态", model="haiku")

// 标准代码工作
sessions_spawn(task="构建 REST API 端点", model="sonnet")

// 架构决策
sessions_spawn(task="设计多租户数据库模式", model="opus")

对于定时任务

{
  "payload": {
    "kind": "agentTurn",
    "model": "haiku"
  }
}

除非任务确实需要推理,否则定时任务一律使用 Haiku。


📊 快速决策树

是问候、查找、状态检查或一两句话能回答的任务吗?
  是 → HAIKU
  否 ↓

涉及代码、分析、规划、写作或多步骤任务吗?
  是 → SONNET
  否 ↓

涉及架构、深度推理或关键决策吗?
  是 → OPUS
  否 → 默认使用 SONNET,若处理困难则升级

📋 快速参考卡片

┌─────────────────────────────────────────────────────────────┐
│                  智能模型切换                                │
│                  Haiku → Sonnet → Opus                      │
├─────────────────────────────────────────────────────────────┤
│  💚 HAIKU (最便宜)                                          │
│  • 问候、状态检查、快速查找                                  │
│  • 事实问答、定义、提醒                                      │
│  • 简单文件操作、一两句话回答                                │
├─────────────────────────────────────────────────────────────┤
│  💛 SONNET (标准)                                           │
│  • 代码 > 10 行、调试                                        │
│  • 分析、比较、规划                                          │
│  • 报告、提案、长文写作                                      │
├─────────────────────────────────────────────────────────────┤
│  ❤️ OPUS (复杂)                                             │
│  • 架构决策                                                 │
│  • 复杂调试、多文件重构                                      │
│  • 战略规划、深度研究                                        │
├─────────────────────────────────────────────────────────────┤
│  💡 规则:如果人类需要 > 30 秒思考 → 升级                    │
│  💰 成本:Haiku 1x → Sonnet 12x → Opus 60x                  │
└─────────────────────────────────────────────────────────────┘

专为仅使用 Claude Haiku、Sonnet 和 Opus 的环境构建。
灵感来源于 save-money 技能,并扩展为三层渐进策略。

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor