每一轮对话,你的 Agent 都会向 API 发送相同的系统提示词——多达数千个 Token。如果不使用缓存,你每次都要为这些相同的 Token 支付全价。开启缓存后,后续对话轮次的成本将降低 90%。
问题所在:重复处理相同的提示词
你的 OpenClaw Agent 的系统提示词包括:
- SOUL.md 人格指令
- 所有已安装技能的操作说明
- 记忆上下文
- 用户偏好
这些内容加起来很容易达到 3,000–10,000 个 Token。在每一次交互中,这些 Token 都会作为输入发送给 API。如果不使用提示词缓存 (Prompt Caching):
- 第 1 轮:5,000 个系统 Token → 全价
- 第 2 轮:相同的 5,000 个 Token + 新消息 → 再次支付全价
- 第 100 轮:仍然在为相同的 5,000 个 Token 支付全价
以 $3/1M 输入 Token (Sonnet) 计算,5,000 个 Token × 300 轮/天 = $4.50/天 仅在系统提示词上。
ClawBridge 如何检测(诊断 A06)
成本控制中心会检查:
- 是否启用了提示词缓存? —— 如果未启用,立即建议开启。
- 缓存命中率 —— 如果已启用缓存但命中率低于 50%,可能存在配置或提示词顺序问题。
- 潜在节省额 —— 根据你的每日系统提示词总量计算全价与缓存价之间的差额。
一键修复
点按应用 (Apply) 即可在你的 OpenClaw 配置中启用提示词缓存。ClawBridge 会针对你的供应商(Anthropic、OpenAI 等)设置合适的缓存参数。
提示词缓存如何工作
启用缓存后:
- 第一轮对话以正常价格发送完整的系统提示词。
- 后续轮次重复使用缓存版本,输入 Token 享受 90% 的折扣。
- 缓存在一段闲置时间后(通常为无请求后 ~5 分钟)会自动重置。
这种节省是即时且自动的——且不会改变 Agent 的行为或产出内容。
权衡
- 缓存生存时间 (TTL):如果 Agent 在请求之间闲置超过 ~5 分钟,缓存就会过期,下一轮将支付全价。对于零星使用的 Agent,节省额可能会较低。
- 提示词更改会导致缓存失效:如果你的系统提示词频繁更改(例如每轮都注入动态记忆),缓存的效果会大打折扣。
- 供应商支持:并非所有供应商都同样支持提示词缓存。Anthropic 原生支持;其他供应商可能有不同的机制。
真实数据
系统提示词为 5,000 个 Token,每天 300 次交互,使用 Claude Sonnet:
| 场景 | 每日输入成本 | 每月成本 |
|---|---|---|
| 无缓存 | 300 × 5,000 × $3/1M = $4.50 | $135 |
| 有缓存 (90% 命中率) | 30 次全价 + 270 次缓存 (1折) = $0.86 | $25.80 |
| 节省额 | 每月节省 $109.20 |
提示词缓存通常是整个成本控制套件中单项影响最大的优化。
常见问题
问:缓存会影响响应质量吗? 答:不会。AI 接收到的是完全相同的信息。缓存是供应商端的优化——模型甚至感知不到它的发生。
问:如果我更新了 SOUL.md 会怎样? 答:当系统提示词更改时,缓存会自动失效。下一轮对话将支付全价,随后的轮次将再次被缓存。
ClawBridge 是免费且开源 (MIT 协议) —— 秒速安装,永久拥有。 免费获取 ClawBridge →