7.4 主流推理模型深度对比
7.4.1 四大推理模型的风景线
OpenAI o1/o3:严谨的数学家
特点速览
工作原理
具体例子:数学题
o1的思考过程(可见):
[思考开始]
这是一个二次方程。我有几种方法:
方法1:配方法
x² - 5x + 6 = 0
x² - 5x + (5/2)² - (5/2)² + 6 = 0
(x - 5/2)² - 25/4 + 6 = 0
(x - 5/2)² = 25/4 - 6 = 25/4 - 24/4 = 1/4
x - 5/2 = ±1/2
x = 5/2 ± 1/2
所以 x = 3 或 x = 2
方法2:因式分解
x² - 5x + 6 = 0
寻找两个数,乘积是6,和是-5
那就是-2和-3
(x - 2)(x - 3) = 0
所以 x = 2 或 x = 3
方法3:求根公式
x = (5 ± √(25-24))/2 = (5 ± 1)/2
x = 3 或 x = 2
[比较]
三种方法都得到相同答案:x = 2 或 x = 3
因式分解最简洁
[最终答案]
x = 2 或 x = 3
[思考结束]
答案:方程的解是 x = 2 和 x = 3何时选择o1/o3
Anthropic Claude Extended Thinking:富有同情心的思想家
特点速览
工作原理
具体例子:开放性问题
何时选择Claude Extended Thinking
DeepSeek-R1:经济高效的工程师
特点速览
工作原理
成本对比
何时选择DeepSeek-R1
Google Gemini Deep Research:知识的聚合家
特点速览
工作原理
具体例子:研究问题
何时选择Gemini Deep Research
7.4.2 快速选择指南
7.4.3 四大模型的评测对比
7.4.4 本节小结
7.4.5 思考题
最后更新于
