6.2 零样本与少样本思维链

思维链提示可以分为零样本和少样本两种形式。两者各有特点和适用场景,本节将详细介绍它们的方法和应用。

6.2.1 零样本思维链

零样本思维链不需要提供推理示例,仅通过简单的触发语句即可激发模型的推理能力。

核心方法

最著名的零样本 CoT 触发语是:

Let's think step by step.

或中文版本:

让我们一步一步思考。

使用示例

问题:一个农场有 24 只鸡和 12 只鸭。农场主又买了 6 只鸡和卖出 4 只鸭。
现在农场总共有多少只家禽?

让我们一步一步思考:

模型会自动生成推理步骤并得出答案。

常用触发语变体

零样本 CoT 的优势

  • 简单易用:只需添加一句话

  • Token 高效:不需要长篇示例

  • 通用性强:适用于各种推理任务

  • 模型无关:无需针对特定任务设计示例

6.2.2 少样本思维链

少样本思维链通过提供包含完整推理过程的示例,引导模型学习推理模式。

基本结构

完整示例

6.2.3 零样本与少样本对比

6.2.4 选择策略

选择零样本 CoT 的情况

选择少样本 CoT 的情况

6.2.5 少样本 CoT 的示例设计

推理步骤清晰

每个步骤应该清晰独立,有明确的输入和输出:

覆盖典型推理模式

示例应该覆盖任务中常见的推理模式:

展示错误处理

有时可以包含如何处理特殊情况的示例:

6.2.6 增强零样本 CoT 的技巧

结构化触发

角色结合

反思要求

6.2.7 常见问题与解决方案

问题 1:推理步骤过于冗长

问题 2:推理偏离正轨

问题 3:最终答案格式不规范

延伸思考

  1. “让我们一步步思考”这种零样本思维链为什么对大模型有效?它对小模型是否同样有效?

  2. 设计一个少样本思维链提示来解决你工作中的一个推理任务,对比有无推理步骤的输出差异。

最后更新于