第六章把“对话变长就不稳”从模型能力拉回到工程可控:会话键决定状态归属,上下文裁剪控制输入体积,长期记忆文件承载稳定事实,会话压缩保证长会话仍能继续推进且便于回放与审计。
会话先分桶再调优:作用域、身份链接与重置策略决定“是否串话、是否断档、是否可恢复”。
上下文要可控:工具回注结构化,再配合上下文裁剪,避免成本与时延随对话线性失控。
记忆要可维护:只写稳定事实并带来源与更新时间;过程噪声进入每日日志或证据文件。
压缩要可验证:压缩与裁剪应只影响模型输入,不应破坏落盘历史;排障要能按 trace 回放链路。
能否解释某条消息落到哪个会话键,以及重置何时发生?
长会话中输入体积是否可控,裁剪/压缩发生时能否在日志中对账?
记忆文件是否按规则维护(来源、更新时间、可撤销),并能被检索命中?
压缩触发后任务能继续推进,且回放链路可复现?
学完这一章,你的智能体已经拥有了“过目不忘”的能力,可以尝试以下实践:
“第二大脑”与人脉 CRM:通过长期状态持久化,让智能体记住你交谈过的每一个人的细节、喜好与待办,充当数字伴游。
个人专属知识库:向系统注入长文本或专业领域文档,利用记忆机制构建针对个人知识边界的智能问答助手。
语义级历史打捞:跨越几十上百条对话记录,利用内置的语义检索,瞬间定位数周前曾讨论过的一段灵感或代码片段。
第七章进入多智能体与路由:把入口收敛为可控触发面,并用绑定、路由与协作模式把”由谁接管、能做什么、如何回放”做成确定性边界。
📝 发现错误或有改进建议? 欢迎提交 Issuearrow-up-right 或 PRarrow-up-right。
最后更新于11天前