[F]CCAF101
GuideDomainsScenariosBootcampEnterprise
获取备考指南
CCAF101

Ameureka × CCAF101

Privacy PolicyTerms of ServiceContact
CCAF101/认证指南/prompt-caching-context

LEARN · Prompt Caching 上下文管理

Prompt Caching 与上下文预算:稳定前缀、缓存边界和失效策略

学习如何划分稳定前缀与动态上下文,设计 Prompt Caching 的命中、失效、安全和观测策略,并避免缓存过期事实。

EXAM WEIGHT15%
Prompt Caching 适合稳定、重复且可共享的长前缀,例如项目规则和固定参考材料;动态用户数据、频繁变化事实和敏感信息应放在后部并设置明确失效条件,命中率不能以错误复用为代价。

先拆稳定与动态

缓存设计的第一步不是打开某个参数,而是对上下文分类:

  • 稳定项目规则。
  • 长期不变的参考文档。
  • 当前任务状态。
  • 用户输入和临时检索结果。
  • 敏感或高频变化数据。

稳定内容放在前部,动态内容放在后部,可以提高复用机会,也让失效边界更清晰。

适合缓存的内容

适合的内容通常同时满足:

  1. 在多次请求中重复。
  2. 变化频率低。
  3. 体积足够大,复用有实际价值。
  4. 权限范围清晰。
  5. 失效时可以识别。

项目宪法、固定工具说明和版本冻结的参考材料往往符合条件。实时价格、用户隐私、短期会话状态和尚未核实的政策则不适合长期复用。

上下文预算

预算可以按优先级分配:

系统与安全规则       20%
任务目标与当前状态   20%
检索证据             40%
输出空间与缓冲       20%

比例只是 CCAF101 自研练习起点,不是固定标准。实际分配要根据任务、输入长度和输出要求测试。

失效策略

缓存失效必须与事实变化绑定。可用信号包括:

  • 文件内容哈希变化。
  • 规则或文档版本变化。
  • 权限或租户变化。
  • 到达核实期限。
  • 用户明确要求使用最新状态。

只使用时间 TTL 可能过早失效,也可能在关键事实变化后继续复用。更稳妥的做法是“版本/哈希 + 时间上限”。

安全边界

缓存键应包含权限相关维度,避免不同用户或租户共享不应共享的上下文。敏感数据尽量不进入可复用前缀;日志记录命中与失效原因,但不记录完整隐私内容。

观测指标

除命中率外,还要看:

  • 实际延迟变化。
  • 输入成本变化。
  • 因过期内容导致的错误。
  • 不同任务类型的命中分布。
  • 失效原因和频率。

高命中率但事实错误,是失败的缓存系统。

反模式

  • 为了命中率缓存所有上下文。
  • 缓存键忽略权限和版本。
  • 更新规则后没有主动失效。
  • 只看成本,不看质量回归。
  • 把缓存当作长期记忆替代品。

实施清单

  • 稳定前缀与动态后缀已分离。
  • 缓存键包含版本和权限维度。
  • 事实变化能触发主动失效。
  • 敏感数据不进入共享缓存。
  • 观测同时覆盖命中、成本、延迟和错误。
  • 缓存前后运行同一套质量回归。

EDITORIAL RECORD

作者
Ameureka × CCAF101 编辑组
审核
项目操盘人
最后核实
2026-06-21

RELATED PATHS

  • Context Management 考域:记忆、检索、压缩与可靠恢复(15%)
  • Prompt Engineering 考域:结构、约束与评估闭环(20%)
  • RAG 混合检索实战:BM25、向量召回与可追溯答案
  • Prompt Engineering 评估:建立可重复的测试集与回归门禁

来源与使用边界

  • https://docs.anthropic.com/
  • AGENTS.md §8 记忆双向同步

课程归档与竞品归档仅用于知识覆盖和信息架构研究,页面正文、代码与图表均为 CCAF101 原创整理。CCAF101 是独立中文学习社区,并非认证方官网。

Ameureka × CCAF101