第六章 会话、上下文与记忆
本章把智能体的”能聊”变成”能稳定推进任务”:会话用于定义状态归属,上下文用于在 Token 预算内组织可用信息,记忆用于跨会话长期沉淀事实与偏好;三者共同决定系统的可复现性、可观测性与可运维性。通过本章,你将学会如何在有限的资源约束下,让智能体保持长期的、可预测的、可复现的对话能力。
本章内容导读
本章包括以下几个小节:
6.1 会话模型与状态持久化:理解 Session 的标识、生命周期与持久化边界。
6.2 上下文构建与窗口预算:掌握上下文构建策略:选择、裁剪、窗口预算与注入顺序。
6.3 记忆机制:写入、检索与失效:了解记忆机制:主存(Markdown)与检索后端的配合方式。
6.4 压缩与裁剪:折叠与丢弃策略:掌握长会话治理:压缩与裁剪(Compaction/Pruning)的触发条件与取舍。
6.5 本章小结:关键结论与读者自检。
学习目标
完成本章的阅读后,你将能够:
设计会话:为不同场景设计合理的会话隔离与标识策略。
组织上下文:在 Token 预算约束下,有效组织与注入上下文信息。
建立记忆:设计长期记忆机制,让智能体记住重要信息。
管理成长:通过压缩与裁剪,让长期会话保持高效。
最后更新于
