附录 C:资源、工具与参考文献
本附录汇总了全书中引用的重要论文、官方文档及业界优秀的开源实践库,同时推荐学习提示词工程的优质资源和实用工具,供读者进行更深入的拓展学习。
C.1 官方指南与文档
C.1.1 OpenAI
Prompt Engineering Guide OpenAI官方提示词工程指南,包含最佳实践和技巧,非常务实。
GPT Best Practices GPT系列模型的使用最佳实践。
OpenAI Cookbook 官方开源代码示例库。
C.1.2 Anthropic
Claude Prompt Engineering Interactive Tutorial 提供从基础到高级(尤其是 XML 标签约束)的详尽教程。
Claude Prompt Library 官方提供的提示词示例库。
C.1.3 Google
Gemini Prompting Guide Gemini模型的提示词设计指南,关注于长上下文和多模态输入的技巧。
C.2 核心参考文献与研究论文
C.2.1 基础与综述类
Attention Is All You Need Vaswani et al., 2017 - Transformer 架构奠基之作。
Language Models are Few-Shot Learners Brown et al., 2020 - GPT-3 的发布论文,确立了大模型在不调参的情况下仅靠 Few-Shot 即可完成多种任务的范式。
A Systematic Survey of Prompt Engineering in Large Language Models Mizrahi et al., 2024 - 全面的提示词工程技术综述,涵盖分类体系和应用领域。
Unleashing the Potential of Prompt Engineering for Large Language Models Bang et al., 2023 - 一篇全面的提示词工程综述,涵盖基础和高级提示技术、多模态提示、安全性与评估机制。
The Prompt Report: A Systematic Survey of Prompt Engineering Techniques Schulhoff et al., 2024 - 迄今最全面的提示词工程综述:58种LLM技术、40种多模态技术、33个标准术语。
C.2.2 推理与思维链
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Wei et al., 2022 - 谷歌大脑提出的 CoT,提示词工程领域最重要的里程碑之一。
Self-Consistency Improves Chain of Thought Reasoning Wang et al., 2022 - 提出多路径采样和多数投票的自一致性机制。
Tree of Thoughts: Deliberate Problem Solving with Large Language Models Yao et al., 2023 - 将 CoT 推进到树状结构搜索,适用于极高复杂度任务。
C.2.3 工具调用与智能体
ReAct: Synergizing Reasoning and Acting in Language Models Yao et al., 2022 - 提出了 Thought-Action-Observation 范式。
C.2.4 自动化与评测
Large Language Models Are Human-Level Prompt Engineers Zhou et al., 2022 - APE (Automatic Prompt Engineer) 论文。
C.2.5 检索增强生成
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks Lewis et al., 2020 - RAG 原始论文。
C.3 开源框架与开发工具
C.3.1 开发框架
LangChain 本书多次提及,目前应用最广的 LLM 开发框架,提供了丰富的工具链与 Pipeline 抽象。 特点:提示词模板管理、链式调用、Agent构建、丰富的集成。
LlamaIndex 专注于数据接入和RAG的框架。 特点:多种数据源连接器、灵活的索引结构、查询引擎。
DSPy 斯坦福大学推出的用于自动编译和优化模型提示词的框架。用代码与评估指标代替手工撰写长提示词。
AutoGen 微软的多Agent协作框架。 特点:Agent对话协作、人机协作、代码执行。
CrewAI 轻量级的Agent团队协作框架。
C.3.2 测试与评测工具
Promptfoo 广受欢迎的开源提示词测试、评测和版本对齐工具,支持 LLM-as-a-judge。
PromptLayer 提示词版本控制和监控平台。 功能:API调用日志、提示词版本管理、性能分析。
LangSmith LangChain官方的调试和监控工具。
C.3.3 向量数据库
Pinecone: 托管的向量数据库服务。 Weaviate: 开源向量搜索引擎。 Chroma: 轻量级的嵌入式向量数据库。 Qdrant: 高性能的向量相似度搜索引擎。
C.3.4 其他项目
Awesome Prompt Engineering 社区维护的提示词工程学习资源大列表。
awesome-chatgpt-prompts 精选的ChatGPT提示词集合。
C.4 实用平台与测试工具
C.4.1 提示词测试
OpenAI Playground OpenAI官方的交互式测试环境。
Anthropic Console Claude的测试控制台。
Google AI Studio Google提供的多模态提示词开发与API测试平台。
C.4.2 Token计算
OpenAI Tokenizer 可视化Token分词工具。
tiktoken (Python库)
C.4.3 提示词优化
PromptPerfect AI驱动的提示词优化工具。
Prompt Generator 各种在线的提示词生成器工具。
C.5 扩展学习资源
C.5.1 在线课程
DeepLearning.AI - ChatGPT Prompt Engineering for Developers 由OpenAI和DeepLearning.AI联合推出的免费课程。
Prompt Engineering Guide (DAIR.AI) 全面的提示词工程学习指南,涵盖各种技术。
C.5.2 博客与社区
Lil'Log (Lilian Weng) OpenAI研究员的技术博客,深入浅出。
Reddit - r/PromptEngineering 提示词工程社区,经验分享和讨论。
Discord - LangChain LangChain官方Discord,活跃的开发者社区。
C.5.3 数据集与Benchmark
MMLU (Massive Multitask Language Understanding): 评估模型多任务理解能力的基准数据集。 HumanEval: 代码生成能力评估数据集。 GSM8K: 数学推理能力评估数据集。 SuperGLUE: 自然语言理解任务集合。
C.5.4 持续学习
资讯聚类:
前沿论文:
arXiv.org (cs.CL, cs.AI)
Papers with Code
知名人物:
@OpenAI, @AnthropicAI, @GoogleAI
@omarsar0 (DAIR.AI创始人)
@lilianweng (OpenAI研究员)
YouTube频道:
Andrej Karpathy
Two Minute Papers
AI Explained
使用建议
从官方文档开始:打下扎实基础
动手实践:使用Playground测试想法
参与社区:学习他人经验
关注前沿:跟踪最新研究和技术
构建项目:在实际应用中深化理解
注:链接和推荐基于2026年1月的信息,请访问时验证最新版本。
最后更新于
