本章小结
本章深入探讨了上下文工程的写入策略,涵盖外部存储、记忆架构、知识库构建和向量数据库实践。
关键概念清单
概念
定义
外部存储
上下文窗口之外的持久化存储系统
记忆架构
多层次的记忆组织结构,包含工作记忆、短期记忆、长期记忆
语义记忆
存储抽象事实和概念的长期记忆类型
情景记忆
存储具体事件和经历的长期记忆类型
知识库
组织化的信息集合,用于为 AI 提供领域知识
向量数据库
专门优化用于存储和检索高维向量的数据库
核心观点
外部存储是必需的:上下文窗口有限,复杂应用需要外部存储支持持久记忆和大规模知识
记忆架构应分层设计:
工作记忆:上下文窗口
短期记忆:会话级别
长期记忆:跨会话持久化
知识库构建是系统工程:
数据收集 → 处理 → 向量化 → 质量验证
需要持续维护更新
向量数据库是语义检索的核心:
选择合适的嵌入模型和索引算法
优化分块策略和检索流程
常见误区
误区一:直接用传统数据库存储知识 正解:语义检索需要向量数据库支持
误区二:知识库越大越好 正解:质量比数量更重要,噪声会降低效果
误区三:向量数据库可以替代其他存储 正解:不同类型数据需要不同存储方案
误区四:构建一次就完成了 正解:知识库需要持续维护和更新
实践建议
从简单开始:先用简单方案验证可行性,再逐步优化
关注分块质量:分块策略对检索效果影响巨大
选择合适工具:根据规模和需求选择向量数据库
建立评估机制:持续监控检索质量和系统性能
规划维护流程:设计知识库的更新和维护机制
预告
下一章将讨论选择策略——如何从存储的大量信息中精准检索当前任务所需的内容。这是 RAG 系统的核心技术。
Last updated
