你正在为每一个请求支付高昂的价格——无论它是复杂的编码任务还是简单的“已确认”。多模型路由会根据请求的复杂度将其分发给最合适的模型,从而大幅降低成本。
问题所在:一刀切的模型策略
大多数 OpenClaw 用户只为所有任务配置了一个单一模型。这意味着:
- 简单任务 (心跳检查、确认、状态检查) → 使用了最高端的模型定价
- 中等任务 (邮件摘要、简单问答) → 使用了最高端的模型定价
- 复杂任务 (编码、调试、多步分析) → 使用了最高端的模型定价 ✓
只有复杂任务真正能从高端模型中获益。对于其他任务,你都在支付不必要的冤枉钱。
解决方案:分层路由 (即将推出)
Note:此功能已列入 ClawBridge 的开发路线图,将在未来的版本中提供。本文旨在解释其设计理念及工作原理。
ClawBridge 的诊断 A10 会分析你的历史 Token 使用情况,并推荐一套多模型路由配置方案:
4 层路由计划
| 层级 | 请求类型 | 建议模型 | 成本级别 |
|---|---|---|---|
| 第 1 层 (免费) | 心跳检查、简单状态检查 | 本地 Ollama (7B) | $0.00 |
| 第 2 层 (低价) | 简单响应、确认操作 | Claude Haiku / GPT-4o-mini | 最低 |
| 第 3 层 (标准) | 每日任务、邮件、摘要 | Claude Sonnet / GPT-4o | 中等 |
| 第 4 层 (高端) | 编码、推理、流程编排 | Claude Opus / GPT-4 | 最高 |
它将如何工作
- 分析:ClawBridge 回顾你过去 7 天的使用情况,按复杂度对每个请求进行分类。
- 分布图:展示你的请求在各个层级中所占的百分比。
- 路由建议:根据你的供应商配置,为每个层级推荐具体的模型。
- 节省预测:基于你的实际使用模式计算确切的节省金额。
预计影响
对于一个每天有 500 个请求的典型用户:
| 请求分布 | 每日请求数 | 修改前 (全部使用 Sonnet) | 修改后 (分层路由) |
|---|---|---|---|
| 第 1 层 (30%) | 150 | $0.68 | $0.00 (本地运行) |
| 第 2 层 (30%) | 150 | $0.68 | $0.08 (使用 Haiku) |
| 第 3 层 (30%) | 150 | $0.68 | $0.68 (使用 Sonnet) |
| 第 4 层 (10%) | 50 | $0.23 | $0.75 (使用 Opus) |
| 总计 | 500 | $2.27/天 | $1.51/天 |
| 每月估算 | $68.10 | $45.30 |
节省额:每月约 $22.80 (33%)。 如果第 1 层使用了本地路由,节省额将提升至 50–70%。
权衡
- 路由准确性:如果分类不正确,可能会将复杂任务发送给便宜的模型,从而导致产出质量下降。路由逻辑必须经过精细调优。
- 回退机制:如果低层级模型失败或产生了低质量结果,系统应自动升级到更高层级。
- 配置复杂度:多模型设置涉及的部分更多。更多的模型意味着需要管理更多的供应商凭据。
- 供应商优先级:直连 API 的供应商(Anthropic, Google API key)应被置于代理供应商(OpenRouter, KiloCode)之前,以避免单点故障。
现在就开始准备
在此功能开发期间,你可以:
- 使用 A01 切换到更便宜的默认模型 —— 这是该理念最简单的实现版本。
- 使用 A02 降低心跳频率 —— 请求越少,需要路由的工作量就越小。
- 使用 A08 设置本地 Ollama 为免费层级做好准备。
ClawBridge 是免费且开源 (MIT 协议) —— 秒速安装,永久拥有。 免费获取 ClawBridge →