前言
大模型上下文工程权威指南
从理论到实践,掌握 AI 时代最核心的工程能力
---
为什么需要这本书?
“提示词工程已死,上下文工程永生。” — 2026
当 LLM 应用从实验走向生产,单纯的提示词设计已不足以构建可靠的 AI 系统。
上下文工程解决的核心问题是:
如何在正确的时间,将正确的信息,以正确的格式,提供给模型?这本书将带你系统掌握这门 AI 时代最核心的工程能力。
💡 本书与提示词工程的关系:《大模型提示词工程指南》 聚焦于单次交互中的提示词设计技巧;而本书则关注更宏观的系统层面——如何通过 RAG、记忆架构、工具调用和上下文压缩等工程手段,在生产环境中持续为模型提供高质量的上下文。建议先阅读提示词工程作为基础,再深入本书的上下文工程体系。
核心内容
你将学到什么
RAG 系统
分块策略、嵌入模型选择、重排序优化、混合检索
记忆架构
工作记忆 / 短期记忆 / 长期记忆的设计与实现
工具调用
Function Calling、MCP 协议、工具设计原则
智能体
单/多智能体上下文管理、状态追踪、记忆学习
生产实践
性能优化、成本控制、可观测性、安全治理
目标读者
本书适合以下读者:
🧑💻 AI 应用开发者
核心技术 + 实践方法
✍️ 提示词工程师
理论基础 + 进阶探索
📊 AI 产品经理
第一部分 + 第三部分概览
🏗️ AI 架构师
全书精读,重点关注生产实践
🔬 研究人员
进阶技术 + 未来展望
💡 前置知识:建议具备基础编程能力和对 LLM 的基本了解。
快速开始
在线阅读
👉 推荐:GitBook 在线版
本地阅读
使用 HonKit 构建本地阅读环境:
启动后访问 http://localhost:4000 即可阅读。
阅读建议
目录概览
📖 完整目录请查看 SUMMARY.md
本书特色
📐 体系完整
15 章内容,从入门到精通的完整学习路径
🔬 理论与实践并重
原理剖析 + 代码示例 + 最佳实践
🆕 紧跟前沿
涵盖 2026 年最新技术进展(Agentic RAG、Graph RAG、MCP 等)
📊 图文并茂
Mermaid 流程图 + 表格对比 + 结构化示例
推荐阅读
本书是 AI 技术丛书的一部分。以下书籍与本书形成互补:
AI 零基础入门,适合缺乏 AI 背景的读者
提示词设计基础,本书的前置读物
Claude 的 MCP 协议与工具使用实践
智能体的上下文管理是本书技术的核心应用场景
上下文安全(提示注入防御、RAG 安全)的深度参考
开源智能体框架中上下文工程的实战应用
参与贡献
欢迎贡献!您可以通过以下方式参与:
许可证
本书采用 CC BY-NC-SA 4.0 许可证。
您可以自由分享和演绎,但需署名、非商业使用、相同方式共享。
项目规则
为了保持书稿的专业性和一致性,本项目遵循以下规则:
术语表规范:本书必须在附录中包含“术语表”(Glossary),用于标注书中出现的关键术语及其解释。
位置:
appendix/glossary.md格式:需按字母顺序或拼音顺序排列,包含中英文对照及简明定义。
致谢
感谢所有为大模型技术发展做出贡献的研究者与工程师,特别是:
Anthropic — 上下文工程领域的开创性工作与 MCP 协议
LangChain、LlamaIndex — RAG 框架的宝贵贡献
所有开源社区的贡献者们
📧 联系作者
如有问题或建议,欢迎通过 Issue 联系。
让我们一起探索上下文工程的世界,构建更智能、更可靠的 AI 应用。
🌟 如果这本书对你有帮助,请给个 Star 支持!
最后更新于
