7.2 推理模型的工作原理
7.2.1 传统LLM的“快速预测”流程
7.2.2 推理模型的“显式思考”流程
具体例子:计算 23 × 47
用户:计算 23 × 47
LLM:答案是 10817.2.3 三个关键的技术创新
1. 思考链的扩展
2. 推理计算
3. 多路径探索
7.2.4 四大推理模型的工作原理对比
OpenAI o1/o3 系列
Claude Extended Thinking
DeepSeek-R1
Google的Gemini Deep Research
7.2.5 推理计算的成本与收益
7.2.6 本节小结
7.2.7 思考题
最后更新于
