你的 Agent 在回答之前会消耗 Token 进行“思考”。虽然深度思考模式能带来更好的推理结果,但它每条响应产生的输出 Token 也是正常模式的 2–3 倍。对于常规任务来说,这就是昂贵的“过度思考”。
问题所在:思考模式始终处于开启状态
OpenClaw 支持“思考”或“扩展推理”模式,让 AI 在回应之前能分步骤解决复杂问题。这对于编码、调试和多步分析来说非常有价值。
但当 thinkingDefault 被设置为“minimal”以上的任何值时,每一个 请求都会执行扩展推理——包括:
- “东京现在几点?”
- “总结这封 3 行字的消息”
- “收到此通知,请确认”
这些任务并不能从深度推理中获益。它们只会产生额外的、由你买单的输出 Token。
ClawBridge 如何检测(诊断 A05)
成本控制中心会检查你的 thinkingDefault 设置并计算:
- 当前的思考 Token 比例:在你的总输出 Token 中,“思考”Token 占比是多少,最终回显 Token 占比又是多少?
- 潜在节省额:如果将思考模式设置为“minimal”,你在输出 Token 上能节省多少钱?
该诊断在以下情况触发:
thinkingDefault未设置为 “minimal”- 输出 Token 成本超过了可配置的阈值
一键修复
点按应用 (Apply) 将 thinkingDefault 设置为 "minimal"。这并不会禁用思考功能——它只是让 AI 在处理常规任务时使用最短的推理路径。在处理复杂任务时,它仍然会进行彻底的推理。
权衡
- 复杂的编码任务:如果你的 Agent 主要负责编写和调试代码,扩展思考模式能带来显著更好的结果。如果代码质量是你的首要任务,请考虑保持开启。
- 非二进制选择:“Minimal”并不意味着“不思考”——它意味着“按需思考”。AI 仍然会进行推理,只是不会展示那么详尽的思考过程。
- 取决于模型:某些模型(如 Opus)比其他模型(如 Haiku)更能从扩展思考中获益。在 Haiku 上,两者的区别往往可以忽略不计。
真实数据
平均每天产生 50K 输出 Token 且开启思考模式的 Agent:
- 开启扩展思考:约 60% 的 Token 是思考 Token → 浪费了 30K 思考 Token
- 按 Sonnet 输出价格计 ($15/1M 输出 Token):30K × $15/1M × 30 天 = 每月节省 $13.50
- 按 Opus 输出价格计 ($75/1M 输出 Token):30K × $75/1M × 30 天 = 每月节省 $67.50
常见问题
问:我的 Agent 会产生质量更低的响应吗? 答:对于常规任务,不会。对于复杂的多步推理,你可能会注意到解释得稍微没那么详细。最终的答案质量通常是一样的。
问:我可以只针对特定任务启用思考吗? 答:通过全局设置无法实现,但你可以在 SOUL.md 中指示 Agent 仅在被明确要求时才“仔细思考”。
ClawBridge 是免费且开源 (MIT 协议) —— 秒速安装,永久拥有。 免费获取 ClawBridge →