本章小结

本章通过医疗、金融、法律、教育四个行业的案例,展示了上下文工程在垂直领域的落地方式:围绕业务风险与任务形态,组合使用写入、选择、压缩与隔离策略,把“可用信息”变成“可控上下文”。

关键概念清单

概念
定义

Grounding(接地)

让回答受限于可追溯的事实来源

负面约束

明确禁止编造、越权、越界的规则

时序相关性

与时间强相关的信息选择与排序策略

权限与隔离

控制可见数据范围,降低越权与污染

核心观点

  1. 医疗:正确性优先:强调引用溯源、拒识与严格边界,避免幻觉。

  2. 金融:多源异构与时效性:强调动态更新、冲突仲裁与可审计。

  3. 法律:结构与逻辑依赖:条款级切片、引用展开与结构化审查清单至关重要。

  4. 教育:记忆与个性化:学生画像与知识状态需要长期维护,并随任务动态注入。

常见误区

  • 误区一:直接把行业文档塞进 RAG 就能用 正解:行业场景往往需要结构化预处理、元数据与权限治理。

  • 误区二:只追求“回答像人” 正解:高风险行业更需要“可验证、可追溯、可拒绝”。

  • 误区三:所有行业用同一套模板 正解:不同领域的关键约束不同(时序、合规、责任边界、引用规范)。

实践建议

  1. 先定义风险清单:明确“哪些错误不可接受”,再倒推上下文策略。

  2. 把引用做成默认能力:让输出自带来源标注与证据片段。

  3. 引入权限与数据治理:尤其是企业/医疗/金融等敏感数据场景。

  4. 按场景建立评估集:用黄金数据集与线上反馈驱动迭代。

预告

下一章将进入综合实战,串联全书方法,构建企业级知识库问答系统。

最后更新于