6.3 自一致性与多路径推理

标准的思维链提示生成单一的推理路径,但这条路径可能是错误的。由 Wang et al. (2022)arrow-up-right 提出的自一致性技术,通过生成多条推理路径并进行一致性投票,显著提升了推理的可靠性。

6.3.1 自一致性的核心思想

自一致性基于一个直觉:如果多条不同的推理路径都得出相同的答案,那么这个答案更可能是正确的

spinner

6.3.2 实现方法

步骤一:多次采样

对同一问题使用相同的思维链提示,但设置较高的 Temperature(如 0.7-0.9),生成多条不同的推理路径。

设置:
- 提示词:[包含思维链引导的提示]
- Temperature:0.7
- 采样次数:5-10 次

步骤二:提取答案

从每条推理路径中提取最终答案:

推理路径 1:
...经过计算,结果是 25...
答案:25

推理路径 2:
...所以最终答案是 25...
答案:25

推理路径 3:
...因此得出 30...
答案:30

步骤三:多数投票

对所有答案进行投票,选择出现次数最多的作为最终答案:

6.3.3 自一致性的优势

提升准确率

研究表明,自一致性可以在思维链基础上进一步提升 5-15%的准确率。

提供置信度指标

投票一致程度可以作为答案置信度的估计:

识别困难问题

如果多条路径给出分散的答案,说明这可能是一个困难问题,需要特别关注。

6.3.4 实现示例

6.3.5 采样策略

采样数量

Temperature 设置

6.3.6 变体技术

加权投票

根据推理路径的质量给予不同权重:

分组一致性

对于复杂问题,可以对每个子问题分别应用自一致性:

6.3.7 适用场景

高度适用

不太适用

6.3.8 实践建议

  1. 答案提取要准确:确保能够从不同格式的回复中正确提取答案

  2. 处理答案等价性:相同答案可能有不同表述

  3. 设置合理的超时:多次采样需要更多时间

  4. 监控成本:自一致性会成倍增加 API 调用次数

讨论

  1. 自一致性需要多次 API 调用——在预算有限的场景下,你如何决定采样次数和成本之间的平衡?

  2. 多数投票适合有“唯一正确答案”的问题,但对于开放性创作任务呢?你会如何改造这一策略?

最后更新于