OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  model-router:具备自动切换能力的综合性 AI 模型智能路由系统

model-router:具备自动切换能力的综合性 AI 模型智能路由系统

 
  sharding ·  2026-02-24 09:52:17 · 2 次点击  · 0 条评论  

名称: model-router
描述: 一个全面的AI模型路由系统,可自动为任何任务选择最优模型。支持设置多个AI提供商(Anthropic、OpenAI、Gemini、Moonshot、Z.ai、GLM),并提供安全的API密钥存储,然后根据任务类型、复杂度和成本优化将任务路由到最佳模型。包含交互式设置向导、任务分类和成本效益委托模式。适用于需要“为此任务使用X模型”、“切换模型”、“最优模型”、“我应该使用哪个模型”的场景,或用于在多个AI提供商之间平衡质量与成本。
版本: 1.1.0


模型路由器

跨多个提供商的智能AI模型路由,实现最优性价比。

根据任务复杂度、类型和您的偏好,自动为任何任务选择最佳模型。支持6大AI提供商,并提供安全的API密钥管理和交互式配置。

🎯 功能概述

  • 分析任务并按类型(编程、研究、创意、简单任务等)进行分类
  • 路由到最优模型,从您配置的提供商中选择
  • 优化成本,对简单任务使用更便宜的模型
  • 保障API密钥安全,通过文件权限(600)和隔离存储实现
  • 提供推荐,包含置信度评分和推理说明

🚀 快速开始

步骤 1: 运行设置向导

cd skills/model-router
python3 scripts/setup-wizard.py

向导将引导您完成:
1. 提供商设置 - 添加您的API密钥(Anthropic、OpenAI、Gemini等)
2. 任务映射 - 为每种任务类型选择模型
3. 偏好设置 - 设置成本优化级别

步骤 2: 使用分类器

# 获取任务对应的模型推荐
python3 scripts/classify_task.py "构建一个React身份验证系统"

# 输出示例:
# 推荐模型: claude-sonnet
# 置信度: 85%
# 成本级别: 中等
# 推理: 匹配到2个关键词:build, system

步骤 3: 通过会话路由任务

# 使用推荐模型生成会话
sessions_spawn --task "调试这个内存泄漏" --model claude-sonnet

# 使用别名快速访问
sessions_spawn --task "天气怎么样?" --model haiku

📊 支持的提供商

提供商 模型 最佳适用场景 密钥格式
Anthropic claude-opus-4-5, claude-sonnet-4-5, claude-haiku-4-5 编程、推理、创意 sk-ant-...
OpenAI gpt-4o, gpt-4o-mini, o1-mini, o1-preview 工具使用、深度推理 sk-proj-...
Gemini gemini-2.0-flash, gemini-1.5-pro, gemini-1.5-flash 多模态、超大上下文(2M) AIza...
Moonshot moonshot-v1-8k/32k/128k 中文语言处理 sk-...
Z.ai glm-4.5-air, glm-4.7 最便宜、快速 多种格式
GLM glm-4-flash, glm-4-plus, glm-4-0520 中文、编程 ID.secret

🎛️ 任务类型映射

默认路由规则(可通过向导自定义):

任务类型 默认模型 原因
simple glm-4.5-air 快速查询时最快、最便宜
coding claude-sonnet-4-5 优秀的代码理解能力
research claude-sonnet-4-5 深度与速度的平衡
creative claude-opus-4-5 最大化创意输出
math o1-mini 专业推理能力
vision gemini-1.5-flash 快速多模态处理
chinese glm-4.7 针对中文优化
long_context gemini-1.5-pro 支持高达2M令牌

💰 成本优化

激进模式

始终使用最便宜且能胜任的模型:
- 简单任务 → glm-4.5-air(约10%成本)
- 编程任务 → claude-haiku-4-5(约25%成本)
- 研究任务 → claude-sonnet-4-5(约50%成本)

节省: 相比始终使用高级模型,可节省50-90%成本

平衡模式(默认)

权衡成本与质量:
- 简单任务 → 廉价模型
- 关键任务 → 高级模型
- 廉价模型失败时自动升级

质量模式

始终使用最佳模型,不考虑成本

🔒 安全性

API密钥存储

~/.model-router/
├── config.json       # 模型映射配置 (chmod 600)
└── .api-keys         # API密钥 (chmod 600)

特性:
- 文件权限限制为所有者(600)
- 与版本控制系统隔离
- 静态加密(通过操作系统文件系统加密)
- 永不记录或打印

最佳实践

  1. 切勿将 .api-keys 提交到版本控制
  2. 使用环境变量进行生产部署
  3. 定期轮换密钥,可通过向导操作
  4. 审计访问权限ls -la ~/.model-router/

📖 使用示例

示例 1: 成本优化工作流

# 首先对任务进行分类
python3 scripts/classify_task.py "从这个CSV中提取价格"

# 结果:简单任务 → 使用 glm-4.5-air
sessions_spawn --task "提取价格" --model glm-4.5-air

# 如有需要,再用更好的模型进行分析
sessions_spawn --task "分析价格趋势" --model claude-sonnet

示例 2: 渐进式升级

# 先尝试廉价模型(60秒超时)
sessions_spawn --task "修复这个bug" --model glm-4.5-air --runTimeoutSeconds 60

# 如果失败,升级到高级模型
sessions_spawn --task "修复复杂的架构bug" --model claude-opus

示例 3: 并行处理

# 使用廉价模型并行处理批量简单任务
sessions_spawn --task "总结文档A" --model glm-4.5-air &
sessions_spawn --task "总结文档B" --model glm-4.5-air &
sessions_spawn --task "总结文档C" --model glm-4.5-air &
wait

示例 4: 使用Gemini进行多模态处理

# 处理包含2M令牌上下文的视觉任务
sessions_spawn --task "分析这100张图片" --model gemini-1.5-pro

🛠️ 配置文件

~/.model-router/config.json

{
  "version": "1.1.0",
  "providers": {
    "anthropic": {
      "configured": true,
      "models": ["claude-opus-4-5", "claude-sonnet-4-5", "claude-haiku-4-5"]
    },
    "openai": {
      "configured": true,
      "models": ["gpt-4o", "gpt-4o-mini", "o1-mini", "o1-preview"]
    }
  },
  "task_mappings": {
    "simple": "glm-4.5-air",
    "coding": "claude-sonnet-4-5",
    "research": "claude-sonnet-4-5",
    "creative": "claude-opus-4-5"
  },
  "preferences": {
    "cost_optimization": "balanced",
    "default_provider": "anthropic"
  }
}

~/.model-router/.api-keys

# 由设置向导生成 - 请勿手动编辑
ANTHROPIC_API_KEY=sk-ant-...
OPENAI_API_KEY=sk-proj-...
GEMINI_API_KEY=AIza...

🔄 版本 1.1 更新

新功能

  • 交互式设置向导,用于引导式配置
  • 安全的API密钥存储,具备文件权限控制
  • 任务到模型映射自定义功能
  • 多提供商支持(6个提供商)
  • 成本优化级别(激进/平衡/质量)

改进

  • ✅ 更好的任务分类,包含置信度评分
  • ✅ 提供商特定的模型推荐
  • ✅ 通过隔离存储增强安全性
  • ✅ 全面的文档

从 1.0 版本迁移

运行设置向导以重新配置:

python3 scripts/setup-wizard.py

📚 命令参考

设置向导

python3 scripts/setup-wizard.py

交互式配置提供商、映射和偏好。

任务分类器

python3 scripts/classify_task.py "您的任务描述"
python3 scripts/classify_task.py "您的任务" --format json

获取模型推荐及推理说明。

列出模型

python3 scripts/setup-wizard.py --list

显示所有可用模型及其状态。

🤝 与其他技能的集成

技能 集成方式
model-usage 跟踪每个提供商的成本以优化路由
sessions_spawn 模型委托的主要工具
session_status 检查当前模型和使用情况

⚡ 性能提示

  1. 从简单开始 - 先尝试廉价模型
  2. 批量处理任务 - 合并多个简单任务
  3. 使用清理功能 - 一次性任务后删除会话
  4. 设置超时 - 防止子代理失控
  5. 监控使用情况 - 跟踪每个提供商的成本

🐛 故障排除

“未找到合适的模型”

  • 运行设置向导以配置提供商
  • 检查API密钥是否有效
  • 验证 .api-keys 文件的权限

“找不到模块”

pip3 install -r requirements.txt  # 如果需要

选择了错误的模型

  1. 通过向导自定义任务映射
  2. sessions_spawn --model 中明确指定模型
  3. 调整成本优化偏好设置

📖 其他资源

2 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor