附录 F:提示词技术决策树

在实际应用中,当你面对一个新任务时,可能会困惑:“我应该用什么技术?是零样本还是少样本?需要思维链吗?”

本附录提供了一个实用的决策树,帮你快速选择合适的提示词工程技术。

快速参考决策树

spinner

详细决策指南

层次 1:区分任务类型

问题:这是什么类型的任务?

有明确答案的任务

包括分类、信息提取、事实问答、代码生成等:

示例:
- "这条评论的情感是正面还是负面?"
- "从文本中提取人名"
- "根据这份合同找出关键条款"
- "将这个函数从 JavaScript 改为 Python"

特点

  • 有标准答案或可验证的结果

  • 可以通过自动化指标评估

  • 容易定义测试用例

开放式生成任务

包括创意写作、头脑风暴、内容创作、对话等:

特点

  • 没有唯一的“正确”答案

  • 质量评估更主观

  • 强调创意和多样性

层次 2:复杂性评估

问题:任务需要多复杂的推理?

简单任务 → 零样本

中等复杂度 → 少样本 + 思维链

复杂任务 → 思维链

层次 3:外部知识需求

问题:任务是否需要超出模型训练数据的信息?

不需要外部知识 → 纯提示词

需要外部知识 → RAG(检索增强生成)

层次 4:交互与行动

问题:模型是否需要执行实际的操作或调用外部系统?

纯信息生成 → 标准提示词

需要执行操作 → ReAct + 工具调用

常见场景决策表

分类任务

信息抽取

问答系统

代码生成

内容生成

数据转换

性能优化决策

当准确率不达标时

当成本过高时

当延迟过高时

技术组合矩阵

实践建议

快速迭代策略

避免的陷阱

总结

  • 简单任务 → 零样本 + 清晰指令

  • 格式问题 → 少样本 + 示例

  • 推理问题 → 思维链

  • 知识问题 → RAG

  • 执行问题 → ReAct

  • 准确率低 → 添加示例或思维链

  • 成本高 → 精简上下文

  • 延迟高 → 流式输出或更小的模型

最后更新于