# 大模型上下文工程权威指南

## 大模型上下文工程权威指南

**从理论到实践，掌握 AI 时代最核心的工程能力**

[![License: CC BY-NC-SA 4.0](https://img.shields.io/badge/License-CC%20BY--NC--SA%204.0-lightgrey.svg)](https://creativecommons.org/licenses/by-nc-sa/4.0/) [![GitHub stars](https://img.shields.io/github/stars/yeasy/context_engineering_guide?style=social)](https://github.com/yeasy/context_engineering_guide) [![Release](https://img.shields.io/github/release/yeasy/context_engineering_guide.svg)](https://github.com/yeasy/context_engineering_guide/releases) ![Last Updated](https://img.shields.io/badge/Last%20Updated-2026.06-blue) [![Online Reading](https://img.shields.io/badge/%E5%9C%A8%E7%BA%BF%E9%98%85%E8%AF%BB-GitBook-brightgreen)](https://yeasy.gitbook.io/context_engineering_guide) [![PDF](https://img.shields.io/badge/PDF-%E4%B8%8B%E8%BD%BD-orange)](https://github.com/yeasy/context_engineering_guide/releases/latest)

[开始阅读](#快速开始) · [核心内容](#核心内容) · [适合谁读](#目标读者) · [参与贡献](#参与贡献)

<img src="/files/mlFnjCAm9yy79mMrFwPT" alt="Context Engineering Guide Cover" width="300">

***

### 为什么需要这本书？

提示词工程没有消失，而是成为上下文工程的基础子集：它负责单次交互中的指令、格式和示例设计；上下文工程进一步管理模型推理时看到的完整信息环境。

当 LLM 应用从实验走向生产，**单纯的提示词设计已不足以构建可靠的 AI 系统**。

上下文工程解决的核心问题是：

```
如何在正确的时间，将正确的信息，以正确的格式，提供给模型？
```

这本书将带你系统掌握这门 AI 时代最核心的工程能力。

> 💡 **本书与提示词工程的关系**：[《大模型提示词工程指南》](https://yeasy.gitbook.io/prompt_engineering_guide) 聚焦于单次交互中的提示词设计技巧；而本书则关注更宏观的系统层面——如何通过检索增强生成（RAG）、记忆架构、工具调用和上下文压缩等工程手段，在生产环境中持续为模型提供高质量的上下文。建议先阅读提示词工程作为基础，再深入本书的上下文工程体系。

| 资源类型   | 主要价值             | 本书补充                       |
| ------ | ---------------- | -------------------------- |
| 厂商官方文档 | API、模型能力和参数的最新说明 | 把多家厂商的能力抽象为统一的上下文工程方法      |
| 框架文档   | 具体框架、SDK 和组件用法   | 解释何时选择 RAG、记忆、工具、智能体和多模态策略 |
| 本书     | 中文系统化教材与实践路径     | 串联生产、安全、评估、成本、案例和可运行示例     |

#### 本书不可替代的定位

| 资料类型   | 关注对象                  | 主要盲区                 | 本书补足                |
| ------ | --------------------- | -------------------- | ------------------- |
| 提示词工程书 | 单次提示词、格式和示例           | 难以覆盖检索、记忆、权限、预算和多轮状态 | 将提示词纳入完整上下文生命周期     |
| RAG 资料 | 文档检索和答案生成             | 容易忽略工具、记忆、对话、观测和事故处理 | 把 RAG 放进生产上下文架构     |
| 智能体资料  | 规划、工具调用和多步任务          | 容易低估上下文污染、压缩和来源追踪    | 给智能体建立上下文边界和治理闭环    |
| 平台文档   | API、参数和 SDK 用法        | 缺少跨平台抽象和工程取舍         | 提供可迁移的方法、检查清单和实战路径  |
| 本书     | 信息来源、预算、结构、权限、评估和故障处理 | 不替代各厂商最新 API 文档      | 帮助读者设计可验证、可治理的上下文系统 |

本书最终把这些主题收束为一张 [上下文架构评审卡](/context_engineering_guide/di-si-bu-fen-gong-cheng-shi-zhan-yu-wei-lai-yan-jin/15_future/15.4_becoming_expert.md)：从任务边界、信息来源、写入/选择/压缩/隔离策略，到权限、预算、失败模式和回归评估，帮助读者判断一个系统是否只是“把组件串起来”，还是具备可验证、可治理、可回滚的上下文工程架构。

***

### 核心内容

| <h4>第一部分：认识上下文工程</h4><ul><li>上下文工程的定义与价值</li><li>从提示词工程到上下文工程的演进</li><li>LLM 基础：上下文窗口与 Token</li><li>理论框架：四大原则与核心策略</li></ul>                       | <h4>第二部分：核心技术与策略</h4><ul><li><strong>Write</strong> — 外部存储与记忆架构</li><li><strong>Select</strong> — RAG 与检索增强生成</li><li><strong>Compress</strong> — 摘要与上下文压缩</li><li><strong>Isolate</strong> — 结构化与隔离设计</li></ul> |
| --------------------------------------------------------------------------------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| <h4>第三部分：进阶技术与架构</h4><ul><li>工具调用与能力扩展</li><li>智能体上下文管理</li><li>自主检索增强生成 (Agentic RAG)</li><li>长上下文模型应用</li><li>多模态上下文管理</li><li>上下文工程反模式</li></ul> | <h4>第四部分：工程实战与未来演进</h4><ul><li>生产环境的最佳实践</li><li>真实系统架构案例分析</li><li>项目实战体验</li><li>基础设施与未来前瞻</li><li>附录 A：术语表</li><li>附录 B：工具与技术生态</li><li>附录 C：参考资源</li><li>附录 D：参考文献</li><li>附录 E：快变事实核验表</li></ul>            |

***

### 五分钟快速上手

“理解上下文窗口”——跟随以下步骤快速掌握核心能力：

1. **认识上下文**（第1-2章）：理解什么是上下文窗口、Token 概念，以及为什么上下文质量影响模型输出
2. **理论框架入门**（第3章）：建立信息环境设计、四大核心策略和上下文评估方法的统一框架
3. **窗口管理实战**（第4-7章）：学习存储、检索、压缩和隔离等关键策略，掌握分块与优化方法
4. **进阶技巧**（第8-10章）：探索工具调用、智能体上下文管理和自主 RAG 的实现方式
5. **实践闭环**（第12-14章）：把方法落到生产工作流，并运行 EnterpriseKnow 最小实验，完成查询、权限过滤、引用回答和评估回归

***

### 你将学到什么

```mermaid
graph LR
    A[理论基础] --> B[核心技术]
    B --> C[实战方法]
    C --> D[进阶探索]

    A1[上下文工程定义] --> A
    A2[LLM 原理] --> A

    B1[RAG 技术栈] --> B
    B2[记忆架构] --> B
    B3[工具调用] --> B

    C1[生产部署] --> C
    C2[智能体开发] --> C

    D1[前沿技术] --> D
    D2[行业趋势] --> D
```

| 主题         | 你将掌握的能力                                                     |
| ---------- | ----------------------------------------------------------- |
| **RAG 系统** | 分块策略、嵌入模型选择、重排序优化、混合检索                                      |
| **记忆架构**   | 工作记忆 / 短期记忆 / 长期记忆的设计与实现                                    |
| **工具调用**   | Function Calling、Model Context Protocol（MCP，模型上下文协议）、工具设计原则 |
| **智能体**    | 单/多智能体上下文管理、状态追踪、记忆学习                                       |
| **生产实践**   | 性能优化、成本控制、可观测性、安全治理                                         |

***

### 目标读者

本书适合以下读者：

| 角色                 | 阅读重点          |
| ------------------ | ------------- |
| 🧑‍💻 **AI 应用开发者** | 核心技术 + 实践方法   |
| ✍️ **提示词工程师**      | 理论基础 + 进阶探索   |
| 📊 **AI 产品经理**     | 第一部分 + 第三部分概览 |
| 🏗️ **AI 架构师**     | 全书精读，重点关注生产实践 |
| 🔬 **研究人员**        | 进阶技术 + 未来展望   |

> 💡 **前置知识**：建议具备基础编程能力和对 LLM 的基本了解。代码路线需要能阅读 Python、HTTP API 和 JSON；生产路线需要理解日志、指标、权限、缓存和发布流程；研究路线需要能读论文摘要、评估指标和基准实验。

### 学习路线图

```mermaid
graph LR
    Start[上下文工程学习入口] --> Ch1[第1章：概述]

    Ch1 --> Role1["AI 应用开发者<br/>第1-3章 → 第4-9章 → 第12-14章"]
    Ch1 --> Role2["提示词工程师<br/>第1-3章 → 第4-8章 → 第11-12章"]
    Ch1 --> Role3["AI 产品经理<br/>第1-3章 → 第12-13章 → 第15章"]
    Ch1 --> Role4["AI 架构师<br/>全书精读，重点第8-10章 → 第12-14章"]
    Ch1 --> Role5["研究人员<br/>第1-3章 → 第10章 → 第12章 → 第15章"]

    Role1 --> End1["掌握核心技术与生产实践"]
    Role2 --> End2["从提示词迈向上下文工程"]
    Role3 --> End3["产品视角的上下文策略"]
    Role4 --> End4["设计生产级上下文架构"]
    Role5 --> End5["前沿技术与研究方向"]
```

| 读者角色         | 学习重点                       | 核心成果                                  |
| ------------ | -------------------------- | ------------------------------------- |
| **AI 应用开发者** | 第1-3章 → 第4-9章 → 第12-14章    | 掌握 RAG、记忆架构、工具调用、智能体和生产部署             |
| **提示词工程师**   | 第1-3章 → 第4-8章 → 第11-12章    | 从提示词工程升级为上下文工程，掌握记忆、检索、压缩、隔离、工具和反模式治理 |
| **AI 产品经理**  | 第1-3章 → 第12-13章 → 第15章     | 理解上下文工程的产品价值、行业落地和未来趋势                |
| **AI 架构师**   | 全书精读，重点第8-10章 → 第12-14章    | 设计高性能、可观测、可治理的上下文工程架构                 |
| **研究人员**     | 第1-3章 → 第10章 → 第12章 → 第15章 | 掌握长上下文、多模态、评估与前沿技术方向                  |

***

### 快速开始

#### 在线阅读

👉 **推荐**：[GitBook 在线版](https://yeasy.gitbook.io/context_engineering_guide/)

#### 下载离线版本

本书提供 PDF 版本供离线阅读，可前往 [GitHub Releases](https://github.com/yeasy/context_engineering_guide/releases/latest) 页面下载最新版本。

如需获取默认分支自动更新的预览版，可直接下载 [context\_engineering\_guide.pdf](https://github.com/yeasy/context_engineering_guide/releases/download/preview-pdf/context_engineering_guide.pdf)。该文件会随主线更新覆盖，不代表正式发布版本。

#### 本地阅读

先安装 [mdPress](https://github.com/yeasy/mdpress)：

```bash
brew tap yeasy/tap
brew install --cask mdpress
mdpress serve
```

启动后访问 [本地阅读地址](http://localhost:9000) 即可阅读。

#### 阅读建议

```
📕 初学者：按顺序阅读全书
📗 有经验者：重点阅读第二、三部分
📘 快速参考：阅读每章末尾的“本章小结”
```

***

### 目录概览

```
第一部分：认识上下文工程
├── 第1章：上下文工程概述
├── 第2章：大语言模型基础
└── 第3章：上下文工程框架

第二部分：核心技术
├── 第4章：写入策略 — 外部存储与记忆
├── 第5章：选择策略 — 检索增强生成
├── 第6章：压缩策略 — 上下文优化
└── 第7章：隔离策略 — 结构化设计

第三部分：进阶技术与架构
├── 第8章：工具调用与能力扩展
├── 第9章：智能体上下文管理
├── 第10章：进阶技术与架构
└── 第11章：反模式与常见错误

第四部分：工程实战与未来演进
├── 第12章：生产环境最佳实践
├── 第13章：行业应用与架构案例
├── 第14章：综合实战 - 构建企业知识库问答系统
└── 第15章：未来展望与发展趋势

附录
├── 附录A：术语表
├── 附录B：工具与技术生态
├── 附录C：参考资源
├── 附录D：参考文献
└── 附录E：快变事实核验表
```

📖 完整目录请查看 [SUMMARY.md](https://github.com/yeasy/context_engineering_guide/blob/main/SUMMARY.md)，正文可从 [第一章：认识上下文工程](/context_engineering_guide/di-yi-bu-fen-ren-shi-shang-xia-wen-gong-cheng/01_overview.md) 开始。

***

### 本书特色

| 特色             | 说明                                                           |
| -------------- | ------------------------------------------------------------ |
| 📐 **生命周期框架**  | 用 Write / Select / Compress / Isolate 组织上下文从写入、选择、压缩到隔离的完整过程 |
| 🔬 **量化评估闭环**  | 提供上下文质量指标、评估集设计、回归阈值和持续改进方法                                  |
| 🧭 **失败案例经济学** | 用 Graph RAG、检索失败、过度压缩和上下文污染解释为什么系统会在生产中失效                    |
| 🛡️ **生产治理视角** | 覆盖权限、来源追踪、成本预算、可观测性、安全治理和事故处理                                |
| ✅ **可运行实战**    | 第 14 章配套 EnterpriseKnow 本地实验，覆盖检索、ACL、来源引用和评估集回归             |

***

### 推荐阅读

本书是 AI 技术丛书的一部分。以下书籍与本书形成互补：

| 书名                                                                       | 与本书的关系                     |
| ------------------------------------------------------------------------ | -------------------------- |
| [《零基础学 AI》](https://yeasy.gitbook.io/ai_beginner_guide)                  | AI 零基础入门，适合缺乏 AI 背景的读者     |
| [《大模型提示词工程指南》](https://yeasy.gitbook.io/prompt_engineering_guide)        | 提示词设计基础，本书的前置读物            |
| [《Claude 技术指南》](https://yeasy.gitbook.io/claude_guide)                   | Claude 的 MCP 协议与工具使用实践     |
| [《智能体 AI 权威指南》](https://yeasy.gitbook.io/agentic_ai_guide)               | 智能体的上下文管理是本书技术的核心应用场景      |
| [《大模型安全权威指南》](https://yeasy.gitbook.io/ai_security_guide)                | 上下文安全（提示注入防御、RAG 安全）的深度参考  |
| [《OpenClaw 从入门到精通》](https://yeasy.gitbook.io/openclaw_guide)             | 开源智能体框架中上下文工程的实战应用         |
| [《大模型原理与架构》](https://yeasy.gitbook.io/llm_internals)                     | 深入理解大语言模型底层逻辑与架构           |
| [《智能体 Harness 工程指南》](https://yeasy.gitbook.io/harness_engineering_guide) | Harness 记忆子系统与上下文组装引擎的工程实现 |

***

### 参与贡献

欢迎贡献！您可以通过以下方式参与：

* 🐛 [提交 Issue](https://github.com/yeasy/context_engineering_guide/issues) — 报告错误或提出建议
* 📝 [提交 PR](https://github.com/yeasy/context_engineering_guide/pulls) — 改进内容或修复 typo
* ⭐ Star 本项目 — 帮助更多人发现这本书

***

### 许可证

本书采用 [CC BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/) 许可证。

您可以自由分享和演绎，但需署名、非商业使用、相同方式共享。

***

### 项目规则

为了保持书稿的专业性和一致性，本项目遵循以下规则：

1. **术语表规范**：本书必须在附录中包含“术语表”（Glossary），用于标注书中出现的关键术语及其解释。
   * 位置：`appendix/glossary.md`
   * 格式：需按字母顺序或拼音顺序排列，包含中英文对照及简明定义。

***

### 致谢

感谢所有为大模型技术发展做出贡献的研究者与工程师，特别是：

* [Anthropic](https://www.anthropic.com/) — 上下文工程领域的开创性工作与 MCP 协议
* [OpenAI](https://openai.com/)、[Google](https://ai.google/)、[Meta](https://ai.meta.com/) — LLM 技术的持续创新
* [LangChain](https://langchain.com/)、[LlamaIndex](https://llamaindex.ai/) — RAG 框架的宝贵贡献
* 所有开源社区的贡献者们

***

**📧 联系作者**

如有问题或建议，欢迎通过 [Issue](https://github.com/yeasy/context_engineering_guide/issues) 联系。

***

*让我们一起探索上下文工程的世界，构建更智能、更可靠的 AI 应用。*

**🌟 如果这本书对你有帮助，请给个 Star 支持！**


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://yeasy.gitbook.io/context_engineering_guide/readme.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
