6.3 记忆机制:写入、检索与失效

本节以官方记忆系统为准讲清“记忆存在哪里、怎样被检索、怎样避免污染”。OpenClaw 的长期记忆以工作区文件为中心,并配套向量索引与内置记忆工具(例如 memory_searchmemory_get)。掌握这些机制后,才能把记忆从“越积越乱”变成“可维护资产”。

6.3.1 双层记忆结构:MEMORY.md 与每日日志

根据官方设计,OpenClaw 的记忆基于“文件即真相(files are the source of truth)”的思想存储于工作区,主要由两层组成:

  • 长期记忆(MEMORY.md:存放精选持久化偏好、配置决定与沉淀经验,放在工作区根目录。

    • 安全与隐私边界:据官方文档约束,MEMORY.md 仅在**私聊主会话(direct chat)**中被加载约束,绝不会在群组会话(group chat)中注入,从而保护用户的私密信息。

  • 每日日志(memory/YYYY-MM-DD.md:存放阶段性项目进展、当天的探讨细节。会话启动时,系统默认只会读取“今天加昨天”的文件数据来维系短期事件的连贯性。

这种设计的工程意义是:把“可复用事实”与“过程噪声”分开,让事后的检索与上下文注入保持清爽的信噪比。

6.3.2 写入规则与时机:只记有价值的事实

官方关于“何时写入记忆”的最佳实践建议如下:

  • 写入 MEMORY.md:记录高价值的用户偏好、重要决策或稳定状态配置。

  • 写入 memory/YYYY-MM-DD.md:记录频繁但阶段性的开发操作、项目调试进度的日常流水。

  • 立即写入:无论何时,当用户明确表达“记住这个(remember this)”时,第一时间将该条目持久化。

此外,记忆写入最常见的失败是把推测当成了事实。我们建议把写入规则收敛为以下硬约束:

  • 稳定:跨会话复用,短期不易过期。

  • 可追溯:必须来自工具明确回执或有显式确诊依据,而不是基于大模型的一句猜测推理。

  • 可纠错:允许随时撤销更新替换,拒绝将错误信息永久固化。

实战防坑:坏记忆与好记忆

  • 坏记忆(模型的主观推测或短时情绪记录):“用户今天好像心情不好,且遇到了一个难以排查的 Node.js OOM BUG。”这种文字明天就失效了,且浪费 Token。

  • 好记忆(客观、可追溯的事实与参数配置):“用户偏好默认在工作流脚本中使用 Python。当前生产 Kubernetes 集群为 prod-cluster-us,且需使用指定服务账号运维(来源:2月20日会话)。”

操作示例:在 MEMORY.md 用结构化小节记录事实,并附带来源与更新时间;在 memory/YYYY-MM-DD.md 记录过程性日志。

6.3.3 检索机制:混合向量搜索与精确读取

针对盘子里的(MEMORY.md 加上 memory/**/*.md)诸多碎片,官方记忆工具提供了两种主流手段取数:

  • 记忆搜索:memory_search — 默认采用混合搜索算法(BM25 加上 向量相似度),将数据切成小块(400 token/分块并设置小额重叠带)。返回带详细文件路径和行号的查询片段。

  • 精确读取:memory_get — 基于已有依据读取内容,精确命中特定行,防污染。

最佳配置项:调优记忆搜索权重 你还可以通过 agents.defaults.memorySearch 配置 JSON 针对搜索权重进行调优。实测下来给向量加上略高权重有助于贴合业务:

操作要点:检索结果永远要遵循少而精的逻辑。把大量候选项一股脑子全灌入上下文,只会起到让模型“盲目重视全体噪音”的副作用。

6.3.4 失效与清理:让记忆有生命周期

长期系统一定会遇到“事实过期”。建议为每条记忆补齐“来源/更新时间/有效期”,并定期做一次复核:过期则标注失效或迁移到每日日志;新事实覆盖旧事实时保留变更链;遇到冲突事实显式标注冲突点,避免模型自行选择。

  • 过期条目标注失效或迁移到每日日志。

  • 新事实覆盖旧事实时保留变更链。

  • 对冲突事实显式标注冲突点,避免模型自行选择。

最后更新于