6.1 思维链提示的原理与价值

思维链（Chain-of-Thought, CoT）提示是一种通过引导模型展示中间推理步骤来提升复杂任务表现的技术，最早由 Wei et al. (2022) 提出。本节将介绍其基本原理、工作机制和应用价值。

6.1.1 什么是思维链提示

传统的提示方式直接要求模型输出最终答案：

问题：商店有 23 个苹果，卖出了 15 个，又进货了 12 个，现在有多少个？
答案：

模型可能直接输出一个数字，有时对有时错。

思维链提示则引导模型展示推理过程：

问题：商店有 23 个苹果，卖出了 15 个，又进货了 12 个，现在有多少个？

让我们一步步思考：
1. 初始数量：23 个
2. 卖出后剩余：23 - 15 = 8 个
3. 进货后总数：8 + 12 = 20 个

答案：20 个

通过展示中间步骤，模型的准确率显著提升。

说明：上面的“逐步推理输出”是教学示例。真实业务/对外产品中，通常 不建议强制要求模型输出冗长的完整推理过程（会增加 Token 成本，也可能暴露不必要的细节）。更稳妥的做法是：让模型进行多步推理，但只输出 关键步骤/核对点 + 最终答案。

图 6-1：传统提示与思维链提示的对比

6.1.2 为什么思维链有效

1. 分解复杂问题

思维链将复杂问题分解为一系列简单的子问题，每一步都是模型更容易处理的简单操作。

复杂问题："如果 A 比 B 高，B 比 C 高，C 比 D 高，那么 A 和 D 谁高？"

分解后：
步骤 1：A 比 B 高 → A > B
步骤 2：B 比 C 高 → B > C
步骤 3：C 比 D 高 → C > D
步骤 4：综合：A > B > C > D
结论：A 比 D 高

2. 利用生成的中间结果

模型在生成过程中可以“看到”自己之前输出的内容。当中间推理步骤被显式生成后，这些信息成为上下文的一部分，可以被后续推理利用。

3. 激活训练中的推理模式

大语言模型在训练过程中接触过大量包含推理过程的文本（如教科书、论文、解题过程等）。思维链提示激活了这些模式。

4. 减少跳跃性错误

直接输出答案时，模型可能“跳过”某些关键步骤导致错误。明确要求展示步骤可以减少这类遗漏。

5. 以生成长度换计算深度

从计算原理角度理解，思维链的核心是用生成长度换取计算深度——将原本单次前向传播里“压缩式”的推理，转化为多次前向传播分步执行。每一步的输出成为下一步的上下文输入，使模型在每一步都只需要完成较简单的判断，大幅降低了累积出错的概率。这解释了思维链在复杂推理任务上效果如此显著的原因——它把一个难题的“难度”分散到了多个简单步骤里。

6.1.3 思维链的适用场景

高度适用

数学推理：算术问题、方程求解
逻辑推理：逻辑谜题、条件判断
多步骤问题：需要多个步骤才能得出结论
常识推理：需要结合多个常识知识点

效果一般

简单事实问答：直接提取即可，无需推理
创意生成：不需要严格的逻辑步骤
格式转换：规则明确的机械任务

6.1.4 与模型规模的关系

研究发现，思维链的效果与模型规模密切相关：

模型规模与 CoT 效果关系：

小模型（<10B 参数）：效果有限，可能产生无意义的推理步骤
中型模型（10-50B 参数）：有一定提升，但不稳定
大模型（>50B 参数）：效果显著，推理质量高
超大模型（>100B 参数）：效果最佳，复杂推理能力强

这种“涌现”特性意味着思维链更适合在大型模型上应用。

6.1.5 思维链提示的基本形式

直接添加推理要求

问题：[问题描述]

请先完成推理并给出答案，然后用 3-5 条要点列出关键推导/核对点（不要输出冗长推理过程）。

使用触发词

问题：[问题描述]

让我们逐步分析：

结构化推理框架

问题：[问题描述]

请按以下结构分析：
1. 理解：这个问题要求我们做什么？
2. 已知：问题中给出了哪些信息？
3. 推理：如何从已知信息得出答案？
4. 结论：最终答案是什么？

6.1.6 思维链的输出示例

问题：一列火车从 A 站出发，以每小时 80 公里的速度行驶。2 小时后，另一列火车从 B 站出发，以每小时 120 公里的速度追赶。A 站和 B 站相距 40 公里。问第二列火车何时能追上第一列？

思维链回答：

让我们一步步分析这个问题。

1. 理解问题：
   - 火车 1 从 A 站出发，速度 80km/h
   - 2 小时后，火车 2 从 B 站出发，速度 120km/h
   - A 和 B 相距 40km
   - 问火车 2 何时追上火车 1

2. 计算初始状态：
   - 火车 1 行驶 2 小时后的位置：80 × 2 = 160km（距 A 站）
   - 此时火车 2 刚出发，位于 B 站
   - 两车距离：160km - 40km = 120km（火车 1 领先）

3. 计算追赶速度：
   - 速度差：120 - 80 = 40 km/h
   - 这是火车 2 相对于火车 1 的追赶速度

4. 计算追赶时间：
   - 需要追赶的距离：120km
   - 追赶时间：120 ÷ 40 = 3 小时

5. 得出结论：
   火车 2 在出发后 3 小时可以追上火车 1。
   如果从火车 1 出发时算起，是 2 + 3 = 5 小时后。

6.1.7 思维链的价值总结

价值维度        效果
───────────────────────
准确性提升      复杂推理任务准确率可提升 20-50%
可解释性        推理过程可见，便于验证和调试
可教学性        模型的推理可供人类学习参考
可纠错性        错误更容易被定位和纠正
适配性广        适用于多种需要推理的任务类型

思考

设计一个特定的业务场景，在这个场景中，模型输出的“中间推理步骤”比“最终答案”更有价值？
尝试对比一个数学问题在“有思维链”和“无思维链”情况下的输出，分析思维链是如何纠正逻辑错误的。

上一页第六章思维链与推理增强下一页6.2 零样本与少样本思维链

最后更新于 3天前

hashtag6.1.1 什么是思维链提示

hashtag6.1.2 为什么思维链有效

hashtag1. 分解复杂问题

hashtag2. 利用生成的中间结果

hashtag3. 激活训练中的推理模式

hashtag4. 减少跳跃性错误

hashtag5. 以生成长度换计算深度

hashtag6.1.3 思维链的适用场景

hashtag高度适用

hashtag效果一般

hashtag6.1.4 与模型规模的关系

hashtag6.1.5 思维链提示的基本形式

hashtag直接添加推理要求

hashtag使用触发词

hashtag结构化推理框架

hashtag6.1.6 思维链的输出示例

hashtag6.1.7 思维链的价值总结

hashtag思考