返回方案列表

配置多模型路由,将 OpenClaw 成本削减 50–70%

你正在为每一个请求支付高昂的价格——无论它是复杂的编码任务还是简单的“已确认”。多模型路由会根据请求的复杂度将其分发给最合适的模型,从而大幅降低成本。

问题所在:一刀切的模型策略

大多数 OpenClaw 用户只为所有任务配置了一个单一模型。这意味着:

  • 简单任务 (心跳检查、确认、状态检查) → 使用了最高端的模型定价
  • 中等任务 (邮件摘要、简单问答) → 使用了最高端的模型定价
  • 复杂任务 (编码、调试、多步分析) → 使用了最高端的模型定价 ✓

只有复杂任务真正能从高端模型中获益。对于其他任务,你都在支付不必要的冤枉钱。

解决方案:分层路由 (即将推出)

Note:此功能已列入 ClawBridge 的开发路线图,将在未来的版本中提供。本文旨在解释其设计理念及工作原理。

ClawBridge 的诊断 A10 会分析你的历史 Token 使用情况,并推荐一套多模型路由配置方案:

4 层路由计划

层级请求类型建议模型成本级别
第 1 层 (免费)心跳检查、简单状态检查本地 Ollama (7B)$0.00
第 2 层 (低价)简单响应、确认操作Claude Haiku / GPT-4o-mini最低
第 3 层 (标准)每日任务、邮件、摘要Claude Sonnet / GPT-4o中等
第 4 层 (高端)编码、推理、流程编排Claude Opus / GPT-4最高

它将如何工作

  1. 分析:ClawBridge 回顾你过去 7 天的使用情况,按复杂度对每个请求进行分类。
  2. 分布图:展示你的请求在各个层级中所占的百分比。
  3. 路由建议:根据你的供应商配置,为每个层级推荐具体的模型。
  4. 节省预测:基于你的实际使用模式计算确切的节省金额。

预计影响

对于一个每天有 500 个请求的典型用户:

请求分布每日请求数修改前 (全部使用 Sonnet)修改后 (分层路由)
第 1 层 (30%)150$0.68$0.00 (本地运行)
第 2 层 (30%)150$0.68$0.08 (使用 Haiku)
第 3 层 (30%)150$0.68$0.68 (使用 Sonnet)
第 4 层 (10%)50$0.23$0.75 (使用 Opus)
总计500$2.27/天$1.51/天
每月估算$68.10$45.30

节省额:每月约 $22.80 (33%)。 如果第 1 层使用了本地路由,节省额将提升至 50–70%

权衡

  • 路由准确性:如果分类不正确,可能会将复杂任务发送给便宜的模型,从而导致产出质量下降。路由逻辑必须经过精细调优。
  • 回退机制:如果低层级模型失败或产生了低质量结果,系统应自动升级到更高层级。
  • 配置复杂度:多模型设置涉及的部分更多。更多的模型意味着需要管理更多的供应商凭据。
  • 供应商优先级:直连 API 的供应商(Anthropic, Google API key)应被置于代理供应商(OpenRouter, KiloCode)之前,以避免单点故障。

现在就开始准备

在此功能开发期间,你可以:

  1. 使用 A01 切换到更便宜的默认模型 —— 这是该理念最简单的实现版本。
  2. 使用 A02 降低心跳频率 —— 请求越少,需要路由的工作量就越小。
  3. 使用 A08 设置本地 Ollama 为免费层级做好准备。

ClawBridge 是免费且开源 (MIT 协议) —— 秒速安装,永久拥有。 免费获取 ClawBridge →


📖 延伸阅读

Share this:

准备好解决这个问题了吗?

只需 30 秒即可安装 ClawBridge,通过手机全面掌控您的 OpenClaw Agent。