附录 C:资源、工具与参考文献

本附录汇总了全书中引用的重要论文、官方文档及业界优秀的开源实践库,同时推荐学习提示词工程的优质资源和实用工具,供读者进行更深入的拓展学习。

C.1 官方指南与文档

C.1.1 OpenAI

Prompt Engineering Guidearrow-up-right OpenAI官方提示词工程指南,包含最佳实践和技巧,非常务实。

GPT Best Practicesarrow-up-right GPT系列模型的使用最佳实践。

OpenAI Cookbookarrow-up-right 官方开源代码示例库。

C.1.2 Anthropic

Claude Prompt Engineering Interactive Tutorialarrow-up-right 提供从基础到高级(尤其是 XML 标签约束)的详尽教程。

Claude Prompt Libraryarrow-up-right 官方提供的提示词示例库。

C.1.3 Google

Gemini Prompting Guidearrow-up-right Gemini模型的提示词设计指南,关注于长上下文和多模态输入的技巧。

C.2 核心参考文献与研究论文

C.2.1 基础与综述类

Attention Is All You Needarrow-up-right Vaswani et al., 2017 - Transformer 架构奠基之作。

Language Models are Few-Shot Learnersarrow-up-right Brown et al., 2020 - GPT-3 的发布论文,确立了大模型在不调参的情况下仅靠 Few-Shot 即可完成多种任务的范式。

A Systematic Survey of Prompt Engineering in Large Language Modelsarrow-up-right Mizrahi et al., 2024 - 全面的提示词工程技术综述,涵盖分类体系和应用领域。

Unleashing the Potential of Prompt Engineering for Large Language Modelsarrow-up-right Bang et al., 2023 - 一篇全面的提示词工程综述,涵盖基础和高级提示技术、多模态提示、安全性与评估机制。

The Prompt Report: A Systematic Survey of Prompt Engineering Techniquesarrow-up-right Schulhoff et al., 2024 - 迄今最全面的提示词工程综述:58种LLM技术、40种多模态技术、33个标准术语。

C.2.2 推理与思维链

Chain-of-Thought Prompting Elicits Reasoning in Large Language Modelsarrow-up-right Wei et al., 2022 - 谷歌大脑提出的 CoT,提示词工程领域最重要的里程碑之一。

Self-Consistency Improves Chain of Thought Reasoningarrow-up-right Wang et al., 2022 - 提出多路径采样和多数投票的自一致性机制。

Tree of Thoughts: Deliberate Problem Solving with Large Language Modelsarrow-up-right Yao et al., 2023 - 将 CoT 推进到树状结构搜索,适用于极高复杂度任务。

C.2.3 工具调用与智能体

ReAct: Synergizing Reasoning and Acting in Language Modelsarrow-up-right Yao et al., 2022 - 提出了 Thought-Action-Observation 范式。

C.2.4 自动化与评测

Large Language Models Are Human-Level Prompt Engineersarrow-up-right Zhou et al., 2022 - APE (Automatic Prompt Engineer) 论文。

C.2.5 检索增强生成

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasksarrow-up-right Lewis et al., 2020 - RAG 原始论文。

C.3 开源框架与开发工具

C.3.1 开发框架

LangChainarrow-up-right 本书多次提及,目前应用最广的 LLM 开发框架,提供了丰富的工具链与 Pipeline 抽象。 特点:提示词模板管理、链式调用、Agent构建、丰富的集成。

LlamaIndexarrow-up-right 专注于数据接入和RAG的框架。 特点:多种数据源连接器、灵活的索引结构、查询引擎。

DSPyarrow-up-right 斯坦福大学推出的用于自动编译和优化模型提示词的框架。用代码与评估指标代替手工撰写长提示词。

AutoGenarrow-up-right 微软的多Agent协作框架。 特点:Agent对话协作、人机协作、代码执行。

CrewAIarrow-up-right 轻量级的Agent团队协作框架。

C.3.2 测试与评测工具

Promptfooarrow-up-right 广受欢迎的开源提示词测试、评测和版本对齐工具,支持 LLM-as-a-judge。

PromptLayerarrow-up-right 提示词版本控制和监控平台。 功能:API调用日志、提示词版本管理、性能分析。

LangSmitharrow-up-right LangChain官方的调试和监控工具。

C.3.3 向量数据库

Pinecone: 托管的向量数据库服务。 Weaviate: 开源向量搜索引擎。 Chroma: 轻量级的嵌入式向量数据库。 Qdrant: 高性能的向量相似度搜索引擎。

C.3.4 其他项目

Awesome Prompt Engineeringarrow-up-right 社区维护的提示词工程学习资源大列表。

awesome-chatgpt-promptsarrow-up-right 精选的ChatGPT提示词集合。

C.4 实用平台与测试工具

C.4.1 提示词测试

OpenAI Playgroundarrow-up-right OpenAI官方的交互式测试环境。

Anthropic Consolearrow-up-right Claude的测试控制台。

Google AI Studioarrow-up-right Google提供的多模态提示词开发与API测试平台。

C.4.2 Token计算

OpenAI Tokenizerarrow-up-right 可视化Token分词工具。

tiktoken (Python库)

C.4.3 提示词优化

PromptPerfectarrow-up-right AI驱动的提示词优化工具。

Prompt Generator 各种在线的提示词生成器工具。

C.5 扩展学习资源

C.5.1 在线课程

DeepLearning.AI - ChatGPT Prompt Engineering for Developers 由OpenAI和DeepLearning.AI联合推出的免费课程。

Prompt Engineering Guide (DAIR.AI)arrow-up-right 全面的提示词工程学习指南,涵盖各种技术。

C.5.2 博客与社区

Lil'Log (Lilian Weng)arrow-up-right OpenAI研究员的技术博客,深入浅出。

Reddit - r/PromptEngineering 提示词工程社区,经验分享和讨论。

Discord - LangChain LangChain官方Discord,活跃的开发者社区。

C.5.3 数据集与Benchmark

MMLU (Massive Multitask Language Understanding): 评估模型多任务理解能力的基准数据集。 HumanEval: 代码生成能力评估数据集。 GSM8K: 数学推理能力评估数据集。 SuperGLUE: 自然语言理解任务集合。

C.5.4 持续学习

资讯聚类:

前沿论文:

  • arXiv.org (cs.CL, cs.AI)

  • Papers with Code

知名人物:

  • @OpenAI, @AnthropicAI, @GoogleAI

  • @omarsar0 (DAIR.AI创始人)

  • @lilianweng (OpenAI研究员)

YouTube频道:

  • Andrej Karpathy

  • Two Minute Papers

  • AI Explained


使用建议

  1. 从官方文档开始:打下扎实基础

  2. 动手实践:使用Playground测试想法

  3. 参与社区:学习他人经验

  4. 关注前沿:跟踪最新研究和技术

  5. 构建项目:在实际应用中深化理解


注:链接和推荐基于2026年1月的信息,请访问时验证最新版本。

最后更新于