# 前言

## 大模型上下文工程权威指南

**从理论到实践，掌握 AI 时代最核心的工程能力**

[![License: CC BY-NC-SA 4.0](https://img.shields.io/badge/License-CC%20BY--NC--SA%204.0-lightgrey.svg)](https://creativecommons.org/licenses/by-nc-sa/4.0/) [![GitHub stars](https://img.shields.io/github/stars/yeasy/context_engineering_guide?style=social)](https://github.com/yeasy/context_engineering_guide) [![Release](https://img.shields.io/github/release/yeasy/context_engineering_guide.svg)](https://github.com/yeasy/context_engineering_guide/releases) ![Last Updated](https://img.shields.io/badge/Last%20Updated-2026.03-blue) [![Online Reading](https://img.shields.io/badge/%E5%9C%A8%E7%BA%BF%E9%98%85%E8%AF%BB-GitBook-brightgreen)](https://yeasy.gitbook.io/context_engineering_guide) [![PDF](https://img.shields.io/badge/PDF-%E4%B8%8B%E8%BD%BD-orange)](https://github.com/yeasy/context_engineering_guide/releases/latest)

[开始阅读](#快速开始) · [核心内容](#核心内容) · [适合谁读](#目标读者) · [参与贡献](#参与贡献)

![Context Engineering Guide Cover](/files/mlFnjCAm9yy79mMrFwPT)---

### 为什么需要这本书？

> “提示词工程已死，上下文工程永生。” — 2026

当 LLM 应用从实验走向生产，**单纯的提示词设计已不足以构建可靠的 AI 系统**。

上下文工程解决的核心问题是：

```
如何在正确的时间，将正确的信息，以正确的格式，提供给模型？
```

这本书将带你系统掌握这门 AI 时代最核心的工程能力。

> 💡 **本书与提示词工程的关系**：[《大模型提示词工程指南》](https://yeasy.gitbook.io/prompt_engineering_guide) 聚焦于单次交互中的提示词设计技巧；而本书则关注更宏观的系统层面——如何通过 RAG、记忆架构、工具调用和上下文压缩等工程手段，在生产环境中持续为模型提供高质量的上下文。建议先阅读提示词工程作为基础，再深入本书的上下文工程体系。

***

### 核心内容

| <h4>第一部分：认识上下文工程</h4><ul><li>上下文工程的定义与价值</li><li>从提示词工程到上下文工程的演进</li><li>LLM 基础：上下文窗口与 Token</li><li>理论框架：四大原则与核心策略</li></ul>                       | <h4>第二部分：核心技术与策略</h4><ul><li><strong>Write</strong> — 外部存储与记忆架构</li><li><strong>Select</strong> — RAG 与检索增强生成</li><li><strong>Compress</strong> — 摘要与上下文压缩</li><li><strong>Isolate</strong> — 结构化与隔离设计</li></ul> |
| --------------------------------------------------------------------------------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| <h4>第三部分：进阶技术与架构</h4><ul><li>工具调用与能力扩展</li><li>智能体上下文管理</li><li>自主检索增强生成 (Agentic RAG)</li><li>长上下文模型应用</li><li>多模态上下文管理</li><li>上下文工程反模式</li></ul> | <h4>第四部分：工程实战与未来演进</h4><ul><li>生产环境的最佳实践</li><li>真实系统架构案例分析</li><li>项目实战体验</li><li>基础设施与未来前瞻</li><li>附录 A：术语表</li><li>附录 B：工具与技术生态</li><li>附录 C：参考资源</li><li>附录 D：参考文献</li></ul>                                 |

***

### 五分钟快速上手

“理解上下文窗口”——跟随以下步骤快速掌握核心能力：

1. **认识上下文**（第1-2章）：理解什么是上下文窗口、Token 概念，以及为什么上下文质量影响模型输出
2. **理论框架入门**（第3章）：建立信息环境设计、四大核心策略和上下文评估方法的统一框架
3. **窗口管理实战**（第5-7章）：学习检索、压缩和隔离等关键策略，掌握分块与优化方法
4. **进阶技巧**（第8-10章）：探索工具调用、智能体上下文管理和自主 RAG 的实现方式

***

### 你将学到什么

{% @mermaid/diagram content="graph LR
A\[理论基础] --> B\[核心技术]
B --> C\[实战方法]
C --> D\[进阶探索]

```
A1[上下文工程定义] --> A
A2[LLM 原理] --> A

B1[RAG 技术栈] --> B
B2[记忆架构] --> B
B3[工具调用] --> B

C1[生产部署] --> C
C2[智能体开发] --> C

D1[前沿技术] --> D
D2[行业趋势] --> D" %}
```

| 主题         | 你将掌握的能力                        |
| ---------- | ------------------------------ |
| **RAG 系统** | 分块策略、嵌入模型选择、重排序优化、混合检索         |
| **记忆架构**   | 工作记忆 / 短期记忆 / 长期记忆的设计与实现       |
| **工具调用**   | Function Calling、MCP 协议、工具设计原则 |
| **智能体**    | 单/多智能体上下文管理、状态追踪、记忆学习          |
| **生产实践**   | 性能优化、成本控制、可观测性、安全治理            |

***

### 目标读者

本书适合以下读者：

| 角色                 | 阅读重点          |
| ------------------ | ------------- |
| 🧑‍💻 **AI 应用开发者** | 核心技术 + 实践方法   |
| ✍️ **提示词工程师**      | 理论基础 + 进阶探索   |
| 📊 **AI 产品经理**     | 第一部分 + 第三部分概览 |
| 🏗️ **AI 架构师**     | 全书精读，重点关注生产实践 |
| 🔬 **研究人员**        | 进阶技术 + 未来展望   |

> 💡 **前置知识**：建议具备基础编程能力和对 LLM 的基本了解。

### 学习路线图

{% @mermaid/diagram content="graph LR
Start\[上下文工程学习入口] --> Ch1\[第1章：概述]

```
Ch1 --> Role1["AI 应用开发者<br/>第1-3章 → 第4-7章 → 第13章"]
Ch1 --> Role2["提示词工程师<br/>第1-3章 → 第8章 → 第11-12章"]
Ch1 --> Role3["AI 产品经理<br/>第1-3章 → 第13章 → 第15章"]
Ch1 --> Role4["AI 架构师<br/>全书精读，重点第9-10章 → 第13-14章"]
Ch1 --> Role5["研究人员<br/>第1-3章 → 第10-12章 → 第15章"]

Role1 --> End1["掌握核心技术与生产实践"]
Role2 --> End2["从提示词迈向上下文工程"]
Role3 --> End3["产品视角的上下文策略"]
Role4 --> End4["设计生产级上下文架构"]
Role5 --> End5["前沿技术与研究方向"]" %}
```

| 读者角色         | 学习重点                    | 核心成果                       |
| ------------ | ----------------------- | -------------------------- |
| **AI 应用开发者** | 第1-3章 → 第4-7章 → 第13章    | 掌握 RAG、记忆架构、工具调用等核心技术与生产部署 |
| **提示词工程师**   | 第1-3章 → 第8章 → 第11-12章   | 从提示词工程升级为上下文工程，掌握进阶策略      |
| **AI 产品经理**  | 第1-3章 → 第13章 → 第15章     | 理解上下文工程的产品价值与未来趋势          |
| **AI 架构师**   | 全书精读，重点第9-10章 → 第13-14章 | 设计高性能、可观测的上下文工程架构          |
| **研究人员**     | 第1-3章 → 第10-12章 → 第15章  | 掌握长上下文、多模态等前沿技术方向          |

***

### 快速开始

#### 在线阅读

👉 **推荐**：[GitBook 在线版](https://yeasy.gitbook.io/context_engineering_guide/)

### 下载离线版本

本书提供 PDF 版本供离线阅读，可前往 [GitHub Releases](https://github.com/yeasy/context_engineering_guide/releases/latest) 页面下载最新版本。

如需获取默认分支自动更新的预览版，可直接下载 [context\_engineering\_guide.pdf](https://github.com/yeasy/context_engineering_guide/releases/download/preview-pdf/context_engineering_guide.pdf)。该文件会随主线更新覆盖，不代表正式发布版本。

#### 本地阅读

先安装 [mdPress](https://github.com/yeasy/mdpress)：

```bash
brew tap yeasy/tap && brew install mdpress
mdpress serve
```

启动后访问 [本地阅读地址](http://localhost:9000) 即可阅读。

#### 阅读建议

```
📕 初学者：按顺序阅读全书
📗 有经验者：重点阅读第二、三部分
📘 快速参考：阅读每章末尾的“本章小结”
```

***

### 目录概览

```
第一部分：认识上下文工程
├── 第1章：上下文工程概述
├── 第2章：大语言模型基础
└── 第3章：上下文工程框架

第二部分：核心技术
├── 第4章：写入策略 — 外部存储与记忆
├── 第5章：选择策略 — 检索增强生成
├── 第6章：压缩策略 — 上下文优化
└── 第7章：隔离策略 — 结构化设计

第三部分：进阶技术与架构
├── 第8章：工具调用与能力扩展
├── 第9章：智能体上下文管理
├── 第10章：进阶技术与架构
└── 第11章：反模式与常见错误

第四部分：工程实战与未来演进
├── 第12章：生产环境最佳实践
├── 第13章：行业应用与架构案例
├── 第14章：综合实战 - 构建企业知识库问答系统
└── 第15章：未来展望与发展趋势

附录
├── 附录A：术语表
├── 附录B：工具与技术生态
├── 附录C：参考资源
└── 附录D：参考文献
```

📖 完整目录请从 [第一章：认识上下文工程](/context_engineering_guide/di-yi-bu-fen-ren-shi-shang-xia-wen-gong-cheng/01_overview.md) 开始。

***

### 本书特色

| 特色             | 说明                                           |
| -------------- | -------------------------------------------- |
| 📐 **体系完整**    | 15 章内容，从入门到精通的完整学习路径                         |
| 🔬 **理论与实践并重** | 原理剖析 + 代码示例 + 最佳实践                           |
| 🆕 **紧跟前沿**    | 涵盖 2026 年最新技术进展（Agentic RAG、Graph RAG、MCP 等） |
| 📊 **图文并茂**    | Mermaid 流程图 + 表格对比 + 结构化示例                   |

***

### 推荐阅读

本书是 AI 技术丛书的一部分。以下书籍与本书形成互补：

| 书名                                                                       | 与本书的关系                     |
| ------------------------------------------------------------------------ | -------------------------- |
| [《零基础学 AI》](https://yeasy.gitbook.io/ai_beginner_guide)                  | AI 零基础入门，适合缺乏 AI 背景的读者     |
| [《大模型提示词工程指南》](https://yeasy.gitbook.io/prompt_engineering_guide)        | 提示词设计基础，本书的前置读物            |
| [《Claude 技术指南》](https://yeasy.gitbook.io/claude_guide)                   | Claude 的 MCP 协议与工具使用实践     |
| [《智能体 AI 权威指南》](https://yeasy.gitbook.io/agentic_ai_guide)               | 智能体的上下文管理是本书技术的核心应用场景      |
| [《大模型安全权威指南》](https://yeasy.gitbook.io/ai_security_guide)                | 上下文安全（提示注入防御、RAG 安全）的深度参考  |
| [《OpenClaw 从入门到精通》](https://yeasy.gitbook.io/openclaw_guide)             | 开源智能体框架中上下文工程的实战应用         |
| [《大模型原理与架构》](https://yeasy.gitbook.io/llm_internals)                     | 深入理解大语言模型底层逻辑与架构           |
| [《智能体 Harness 工程指南》](https://yeasy.gitbook.io/harness_engineering_guide) | Harness 记忆子系统与上下文组装引擎的工程实现 |

***

### 参与贡献

欢迎贡献！您可以通过以下方式参与：

* 🐛 [提交 Issue](https://github.com/yeasy/context_engineering_guide/issues) — 报告错误或提出建议
* 📝 [提交 PR](https://github.com/yeasy/context_engineering_guide/pulls) — 改进内容或修复 typo
* ⭐ Star 本项目 — 帮助更多人发现这本书

***

### 许可证

本书采用 [CC BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/) 许可证。

您可以自由分享和演绎，但需署名、非商业使用、相同方式共享。

***

### 项目规则

为了保持书稿的专业性和一致性，本项目遵循以下规则：

1. **术语表规范**：本书必须在附录中包含“术语表”（Glossary），用于标注书中出现的关键术语及其解释。
   * 位置：`appendix/glossary.md`
   * 格式：需按字母顺序或拼音顺序排列，包含中英文对照及简明定义。

***

### 致谢

感谢所有为大模型技术发展做出贡献的研究者与工程师，特别是：

* [Anthropic](https://www.anthropic.com/) — 上下文工程领域的开创性工作与 MCP 协议
* [OpenAI](https://openai.com/)、[Google](https://ai.google/)、[Meta](https://ai.meta.com/) — LLM 技术的持续创新
* [LangChain](https://langchain.com/)、[LlamaIndex](https://llamaindex.ai/) — RAG 框架的宝贵贡献
* 所有开源社区的贡献者们

***

**📧 联系作者**

如有问题或建议，欢迎通过 [Issue](https://github.com/yeasy/context_engineering_guide/issues) 联系。

***

*让我们一起探索上下文工程的世界，构建更智能、更可靠的 AI 应用。*

**🌟 如果这本书对你有帮助，请给个 Star 支持！**


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://yeasy.gitbook.io/context_engineering_guide/readme.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
