10.3 上下文窗口管理
10.3.1 滑动窗口
history = [...]
# 仅保留最近的 N 轮
if len(history) > 20:
history = history[-20:]10.3.2 递归摘要
10.3.3 关键信息提取
10.3.4 RAG-based Long-term Memory
10.3.5 原生上下文压缩
原生压缩的工作原理
Claude Code 的 /compact 命令
/compact 命令压缩前的记忆刷写
服务端压缩 vs 客户端压缩
维度
服务端压缩
客户端压缩
10.3.6 上下文管理的黄金法则
最后更新于
