OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

OA0 › 技能包 › model-router：具备自动切换能力的综合性 AI 模型智能路由系统

model-router：具备自动切换能力的综合性 AI 模型智能路由系统

vortex · 2026-02-12 04:42:24 · 65 次点击 · 0 条评论

名称： model-router
描述： 一个全面的AI模型路由系统，可自动为任何任务选择最优模型。支持设置多个AI提供商（Anthropic、OpenAI、Gemini、Moonshot、Z.ai、GLM），并提供安全的API密钥存储，然后根据任务类型、复杂度和成本优化将任务路由到最佳模型。包含交互式设置向导、任务分类和成本效益委托模式。适用于需要“为此任务使用X模型”、“切换模型”、“最优模型”、“我应该使用哪个模型”的场景，或用于在多个AI提供商之间平衡质量与成本。
版本： 1.1.0

模型路由器

跨多个提供商的智能AI模型路由，实现最优性价比。

根据任务复杂度、类型和您的偏好，自动为任何任务选择最佳模型。支持6大AI提供商，并提供安全的API密钥管理和交互式配置。

🎯 功能概述

分析任务并按类型（编程、研究、创意、简单任务等）进行分类
路由到最优模型，从您配置的提供商中选择
优化成本，对简单任务使用更便宜的模型
保障API密钥安全，通过文件权限（600）和隔离存储实现
提供推荐，包含置信度评分和推理说明

🚀 快速开始

步骤 1: 运行设置向导

cd skills/model-router
python3 scripts/setup-wizard.py

向导将引导您完成：
1. 提供商设置 - 添加您的API密钥（Anthropic、OpenAI、Gemini等）
2. 任务映射 - 为每种任务类型选择模型
3. 偏好设置 - 设置成本优化级别

步骤 2: 使用分类器

# 获取任务对应的模型推荐
python3 scripts/classify_task.py "构建一个React身份验证系统"

# 输出示例：
# 推荐模型: claude-sonnet
# 置信度: 85%
# 成本级别: 中等
# 推理: 匹配到2个关键词：build, system

步骤 3: 通过会话路由任务

# 使用推荐模型生成会话
sessions_spawn --task "调试这个内存泄漏" --model claude-sonnet

# 使用别名快速访问
sessions_spawn --task "天气怎么样？" --model haiku

📊 支持的提供商

提供商	模型	最佳适用场景	密钥格式
Anthropic	claude-opus-4-5, claude-sonnet-4-5, claude-haiku-4-5	编程、推理、创意	`sk-ant-...`
OpenAI	gpt-4o, gpt-4o-mini, o1-mini, o1-preview	工具使用、深度推理	`sk-proj-...`
Gemini	gemini-2.0-flash, gemini-1.5-pro, gemini-1.5-flash	多模态、超大上下文（2M）	`AIza...`
Moonshot	moonshot-v1-8k/32k/128k	中文语言处理	`sk-...`
Z.ai	glm-4.5-air, glm-4.7	最便宜、快速	多种格式
GLM	glm-4-flash, glm-4-plus, glm-4-0520	中文、编程	`ID.secret`

🎛️ 任务类型映射

默认路由规则（可通过向导自定义）：

任务类型	默认模型	原因
`simple`	glm-4.5-air	快速查询时最快、最便宜
`coding`	claude-sonnet-4-5	优秀的代码理解能力
`research`	claude-sonnet-4-5	深度与速度的平衡
`creative`	claude-opus-4-5	最大化创意输出
`math`	o1-mini	专业推理能力
`vision`	gemini-1.5-flash	快速多模态处理
`chinese`	glm-4.7	针对中文优化
`long_context`	gemini-1.5-pro	支持高达2M令牌

💰 成本优化

激进模式

始终使用最便宜且能胜任的模型：
- 简单任务 → glm-4.5-air（约10%成本）
- 编程任务 → claude-haiku-4-5（约25%成本）
- 研究任务 → claude-sonnet-4-5（约50%成本）

节省： 相比始终使用高级模型，可节省50-90%成本

平衡模式（默认）

权衡成本与质量：
- 简单任务 → 廉价模型
- 关键任务 → 高级模型
- 廉价模型失败时自动升级

质量模式

始终使用最佳模型，不考虑成本

🔒 安全性

API密钥存储

~/.model-router/
├── config.json       # 模型映射配置 (chmod 600)
└── .api-keys         # API密钥 (chmod 600)

特性：
- 文件权限限制为所有者（600）
- 与版本控制系统隔离
- 静态加密（通过操作系统文件系统加密）
- 永不记录或打印

最佳实践

切勿将 .api-keys 提交到版本控制
使用环境变量进行生产部署
定期轮换密钥，可通过向导操作
审计访问权限：ls -la ~/.model-router/

📖 使用示例

示例 1: 成本优化工作流

# 首先对任务进行分类
python3 scripts/classify_task.py "从这个CSV中提取价格"

# 结果：简单任务 → 使用 glm-4.5-air
sessions_spawn --task "提取价格" --model glm-4.5-air

# 如有需要，再用更好的模型进行分析
sessions_spawn --task "分析价格趋势" --model claude-sonnet

示例 2: 渐进式升级

# 先尝试廉价模型（60秒超时）
sessions_spawn --task "修复这个bug" --model glm-4.5-air --runTimeoutSeconds 60

# 如果失败，升级到高级模型
sessions_spawn --task "修复复杂的架构bug" --model claude-opus

示例 3: 并行处理

# 使用廉价模型并行处理批量简单任务
sessions_spawn --task "总结文档A" --model glm-4.5-air &
sessions_spawn --task "总结文档B" --model glm-4.5-air &
sessions_spawn --task "总结文档C" --model glm-4.5-air &
wait

示例 4: 使用Gemini进行多模态处理

# 处理包含2M令牌上下文的视觉任务
sessions_spawn --task "分析这100张图片" --model gemini-1.5-pro

🛠️ 配置文件

`~/.model-router/config.json`

{
  "version": "1.1.0",
  "providers": {
    "anthropic": {
      "configured": true,
      "models": ["claude-opus-4-5", "claude-sonnet-4-5", "claude-haiku-4-5"]
    },
    "openai": {
      "configured": true,
      "models": ["gpt-4o", "gpt-4o-mini", "o1-mini", "o1-preview"]
    }
  },
  "task_mappings": {
    "simple": "glm-4.5-air",
    "coding": "claude-sonnet-4-5",
    "research": "claude-sonnet-4-5",
    "creative": "claude-opus-4-5"
  },
  "preferences": {
    "cost_optimization": "balanced",
    "default_provider": "anthropic"
  }
}

`~/.model-router/.api-keys`

# 由设置向导生成 - 请勿手动编辑
ANTHROPIC_API_KEY=sk-ant-...
OPENAI_API_KEY=sk-proj-...
GEMINI_API_KEY=AIza...

🔄 版本 1.1 更新

新功能

✅ 交互式设置向导，用于引导式配置
✅ 安全的API密钥存储，具备文件权限控制
✅ 任务到模型映射自定义功能
✅ 多提供商支持（6个提供商）
✅ 成本优化级别（激进/平衡/质量）

改进

✅ 更好的任务分类，包含置信度评分
✅ 提供商特定的模型推荐
✅ 通过隔离存储增强安全性
✅ 全面的文档

从 1.0 版本迁移

运行设置向导以重新配置：

python3 scripts/setup-wizard.py

📚 命令参考

设置向导

python3 scripts/setup-wizard.py

交互式配置提供商、映射和偏好。

任务分类器

python3 scripts/classify_task.py "您的任务描述"
python3 scripts/classify_task.py "您的任务" --format json

获取模型推荐及推理说明。

列出模型

python3 scripts/setup-wizard.py --list

显示所有可用模型及其状态。

🤝 与其他技能的集成

技能	集成方式
model-usage	跟踪每个提供商的成本以优化路由
sessions_spawn	模型委托的主要工具
session_status	检查当前模型和使用情况

⚡ 性能提示

从简单开始 - 先尝试廉价模型
批量处理任务 - 合并多个简单任务
使用清理功能 - 一次性任务后删除会话
设置超时 - 防止子代理失控
监控使用情况 - 跟踪每个提供商的成本

🐛 故障排除

“未找到合适的模型”

运行设置向导以配置提供商
检查API密钥是否有效
验证 .api-keys 文件的权限

“找不到模块”

pip3 install -r requirements.txt  # 如果需要

选择了错误的模型

通过向导自定义任务映射
在 sessions_spawn --model 中明确指定模型
调整成本优化偏好设置

📖 其他资源

提供商文档：
Anthropic
OpenAI
Gemini
Moonshot
Z.ai
GLM
设置： 运行 python3 scripts/setup-wizard.py
支持： 查看 references/ 文件夹获取详细指南

技能包地址：https://github.com/openclaw/skills/tree/main/skills/digitaladaption/model-router/SKILL.md

65 次点击 ∙ 0 人收藏

登录后收藏

0 条回复