# 8.7 DeepSeek-R1：推理模型的黑马

> 用远低于 o1 的训练成本达到相当的推理能力

## 8.7.1 DeepSeek-R1 的出现

2024 年 12 月 DeepSeek 发布了 V3，随后在 2025 年 1 月 20 日又发布了 R1（推理模型版本）。

这有两个重要意义：

1. **速度**：从无到有推出与顶级模型竞争的产品的时间表
2. **推理能力**：证明推理模型可以用相对经济的方式构建

## 8.7.2 性能对标

### 复杂问题上的表现

### 数学与代码推理基准

```
更稳妥的结论应该这样理解：

- 在 DeepSeek 官方技术报告列出的数学、代码和综合推理基准中，R1 确实进入了第一梯队
- 它在若干推理任务上可以与 OpenAI o 系列等强模型正面竞争
- 但不同厂商公布的分数常受提示词、采样设置、评测版本和披露口径影响

因此，不建议把跨厂商对比写成“固定领先几个百分点”的硬结论。
```

**建议来源：**

* [DeepSeek 官方技术报告](https://github.com/deepseek-ai/DeepSeek-R1)
* 相关基准测试的官方说明与评测仓库

## 综合对标结论

```
综合来看，DeepSeek-R1 的真正意义不在于“永远稳压所有对手”，
而在于它证明了：

1. 开源/开放权重路线也能做出第一梯队推理模型
2. 高质量推理能力不一定只能靠最高成本路线获得
3. 推理模型的价格与部署门槛可以继续下降
```

## 8.7.3 如何实现如此低的成本？

## DeepSeek-R1 的架构（推测）

虽然 DeepSeek 没有公开完整细节，但从开源的模型和论文可以推断：

```
推断的R1架构：

基础模型：DeepSeek V3
  ├─ 已经有MLA + MoE的效率优势
  ├─ 已经有很强的基础能力
  └─ 这是推理模型的基础

推理训练：
  ├─ 方法1：强化学习微调
  │  └─ 类似OpenAI o1的方法
  │  └─ 但基于V3的高效基础
  │  └─ 成本更低
  │
  ├─ 方法2：思维链蒸馏
  │  └─ 从大型模型学习思维过程
  │  └─ 然后压缩到小型模型
  │  └─ DeepSeek可能用的方向
  │
  └─ 方法3：混合方法
     └─ 两种方法结合
     └─ 最可能

核心优势：
从已经高效的V3出发
└─ 基础计算成本已经很低
└─ 推理训练的成本也会很低
└─ 总成本是底部的百分比
```

## 成本对比（详细版）

```
成本问题要拆成两层看：

1. 训练成本
   - DeepSeek-V3 论文披露过一次代表性训练运行的成本量级
   - 但这并不等于“R1 全部研发总成本”
   - OpenAI 并未公开 o1 的完整训练账单，因此两者不能做精确的一比一财务对账

2. 使用成本
   - 托管 API 通常按输入/输出 token 计费
   - 开源权重自部署则会转化为显卡、运维、电力和延迟成本
   - 所谓“每道复杂问题固定多少钱”只适合做粗略示意，不适合写成精确结论
```

## 8.7.4 DeepSeek-R1 的思考过程

## 显示思考 vs 隐藏思考

```
OpenAI o1的方法：
思考过程 → 隐藏在内部
用户看不到
直接给出答案

DeepSeek-R1的方法：
思考过程 → 可以选择显示或隐藏
用户可以看到"思路"（如果想要）
或只看最终答案（如果想快速）

这是一个用户体验的优势：
透明性 > 神秘性
用户可以理解AI是如何思考的
```

## 思考效率

```
更稳妥的说法是：

- 推理模型的延迟高度依赖问题难度、上下文长度、服务负载和产品设置
- 公开材料通常不会给出“同一道题固定思考多少秒”的稳定结论
- DeepSeek-R1 的优势更适合描述为“在成本与性能之间取得了很强平衡”，
  而不是写成某类问题永远比 o1 快多少秒
```

## 8.7.5 对整个推理模型市场的影响

## 改变价格预期

```
推理模型在o1之前：
不存在（没有商用推理模型）

推理模型在o1之后：
OpenAI o1：很贵（token成本很高）
用户期望：推理模型就是要贵

推理模型在DeepSeek-R1之后：
DeepSeek-R1：证明强推理模型可以用更低成本路线构建和开放
用户期望：推理能力不应只属于少数高价闭源产品

市场反应：
├─ 闭源厂商面临价格和开放生态压力
├─ 创业公司有机会基于开源权重做垂直产品
├─ 企业会更认真比较 API、私有化和本地部署
└─ 价格趋势仍取决于供应商策略、硬件成本和需求规模
```

## 推理模型的民主化

```
之前（o1时代）：
推理模型是高端产品
├─ 只有有钱的用户能用
├─ 主要用于高价值的任务
└─ 大众无法访问

之后（DeepSeek-R1时代）：
推理模型更接近大众可用
├─ 权重开放后，开发者可以下载和研究
├─ 可以用于日常问题
├─ 在硬件足够时可以本地运行
└─ 在线服务和 API 仍会受服务条款、速率、地区和价格限制

影响：
└─ 推理能力变成"基础设施"而不是"奢侈品"
```

## 8.7.6 开源 vs 闭源的策略

## DeepSeek-R1 的开源策略

```
DeepSeek 的做法：
开放了 R1 相关权重与若干 Distill 模型

└─ 任何人都可以下载
└─ 可以在满足硬件条件时本地运行
└─ 可以继续做微调和二次开发
└─ 商业使用需遵循对应许可证与合规要求

为什么这样做？

表面理由：
├─ 相信开源的力量
├─ 推动AI民主化
└─ 获得社区支持

战略理由：
├─ 无法靠闭源竞争
│  （已经有o1了）
├─ 开源是更好的差异化
│  （成本低、可本地运行、可定制）
├─ 围绕开源建立生态
│  （而不是API调用）
└─ 长期价值 > 短期API收入

对比OpenAI的闭源策略：
OpenAI：保护产品，通过API赚钱
DeepSeek：开放权重，推动生态和部署选择

哪个更聪慧？
└─ 闭源路线更容易直接变现
└─ 开源路线更容易扩大采用和二次创新
└─ 谁更成功，取决于产品体验、生态、合规和成本结构
```

## 8.7.7 DeepSeek-R1 对不同用户的意义

## 对于开发者

```
之前：
├─ 想用推理模型 → 必须用OpenAI的o1
├─ 成本很高
└─ 无法定制

之后：
├─ 可以下载DeepSeek-R1开源版本
├─ 在自己的服务器上运行
├─ 成本只是计算资源（自部署后边际成本主要是显卡和电力）
├─ 可以完全定制
└─ 无需依赖OpenAI
```

## 对于创业公司

```
之前的困境：
├─ 想提供"推理AI服务" → 成本太高
├─ 无法大规模推理用户
└─ 商业模式不可行

之后的机会：
├─ 可以用DeepSeek-R1作为基础
├─ 成本可控
├─ 可以提供专业化的服务
└─ 商业模式可行

例子：
编程助手 → 可以用DeepSeek-R1进行深入代码分析
学习平台 → 可以提供个性化的推理帮助
企业用户 → 可以自部署进行机密推理
```

## 对于学生和个人

```
之前：
├─ 想用推理能力 → 必须付钱给OpenAI
├─ 每个问题花几毛钱
└─ 只能用API

之后：
├─ 可以免费下载DeepSeek-R1
├─ 在自己的电脑上运行（如果有GPU）
├─ 本地运行没有 API 单次调用费，但有硬件、电力、部署和维护成本
├─ 在线服务通常仍有速率、可用性、隐私和条款限制
└─ 可用于学习开源推理模型的工作方式
```

## 8.7.8 本节小结

DeepSeek-R1 证明了：

* 推理模型可以以经济的方式构建
* 不需要数十亿的融资来竞争
* 开源可以是比闭源更强的策略

在推理模型领域：

* 在数学、代码和推理等部分公开基准上进入第一梯队
* 成本路线明显更有压力测试价值
* 自由度更高（可本地运行、可研究、可定制），但不等于所有任务都优于闭源模型

这可能改变推理模型的整个市场格局。

## 8.7.9 与其他章节的联系

📖 **延伸阅读**：

* 想了解推理模型的工作原理？请参阅《第 7.2 推理模型的工作原理》
* 想了解 DeepSeek 使用的 MLA 和 MoE 架构？请参阅《第 8.6 技术创新：MLA 和 MoE》
* 想比较不同推理模型的性能？请参阅《第 7.4 主流推理模型深度对比》
* 对量子计算如何破解加密感兴趣？请参阅《第十六章 AI 硬件与量子计算入门》

## 8.7.10 思考题

1. 如果 DeepSeek-R1 权重开放且本地运行成本持续下降，闭源推理模型如何保持竞争力？
2. 推理模型的开源对 AI 安全有什么影响？（好的和坏的）
3. 五年后，用户会如何在闭源 API、开源权重、本地部署和托管服务之间做选择？


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://yeasy.gitbook.io/ai_beginner_guide/di-er-bu-fen-he-xin-ji-shu-jie-xi/08_new_architectures/8.7_deepseek_r1.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.