8.7 DeepSeek-R1:推理模型的黑马

用远低于 o1 的训练成本达到相当的推理能力

8.7.1 DeepSeek-R1 的出现

2024 年底 DeepSeek 发布了 V3,随后在 2025 年 1 月又发布了 R1(推理模型版本)。

这有两个重要意义:

  1. 速度:能够与大型公司竞争的时间表

  2. 推理能力:证明推理模型可以用更经济的方式构建

8.7.2 性能对标

复杂问题上的表现

MATH-500 基准测试

MATH-500(500道复杂数学问题集):

DeepSeek-R1:97%
OpenAI o1:96%
Claude 3.5 Extended:95%

→ DeepSeek领先1个百分点

数据来源:

AIME 2024 数学竞赛

数据来源:

Codeforces/LeetCode 代码推理

数据来源:

综合对标结论

8.7.3 如何实现如此低的成本?

DeepSeek-R1 的架构(推测)

虽然 DeepSeek 没有公开完整细节,但从开源的模型和论文可以推断:

成本对比(详细版)

8.7.4 DeepSeek-R1 的思考过程

显示思考 vs 隐藏思考

思考效率

8.7.5 对整个推理模型市场的影响

改变价格预期

推理模型的民主化

8.7.6 开源 vs 闭源的策略

DeepSeek-R1 的开源策略

8.7.7 DeepSeek-R1 对不同用户的意义

对于开发者

对于创业公司

对于学生和个人

8.7.8 本节小结

DeepSeek-R1 证明了:

  • 推理模型可以以经济的方式构建

  • 不需要数十亿的融资来竞争

  • 开源可以是比闭源更强的策略

在推理模型领域:

  • 性能 ≥ OpenAI o1

  • 成本 << OpenAI o1

  • 自由度 > OpenAI o1(可本地运行、可定制)

这可能改变推理模型的整个市场格局。

8.7.9 与其他章节的联系

📖 延伸阅读

  • 想了解推理模型的工作原理?请参阅《第 7.2 推理模型的工作原理》

  • 想了解 DeepSeek 使用的 MLA 和 MoE 架构?请参阅《第 8.6 技术创新:MLA 和 MoE》

  • 想比较不同推理模型的性能?请参阅《第 7.4 主流推理模型深度对比》

  • 对量子计算如何破解加密感兴趣?请参阅《第十六章 AI 硬件与量子计算入门》

8.7.10 思考题

  1. 如果 DeepSeek-R1 完全开源且免费,OpenAI o1 如何保持竞争力?

  2. 推理模型的开源对 AI 安全有什么影响?(好的和坏的)

  3. 五年后,还会有人付费使用 o1 吗?还是都用免费的 DeepSeek?

最后更新于