8.5 DeepSeek 是什么:从小创业到独角兽
8.5.1 DeepSeek 的三个版本
DeepSeek的演化:
DeepSeek V1(2023年底)
└─ 开源模型,初次亮相
└─ 性能:不错,但不突出
DeepSeek V2(2024年中)
└─ 升级版本
└─ MLA架构首次亮相
└─ 开始被关注
DeepSeek V3(2024年底)
└─ 最新版本,也是最强版本
└─ 多个新创新
└─ 性能与GPT-4-Turbo相当
└─ 成本仅为GPT-4的1/18
DeepSeek-R1(2025年1月)
└─ 推理模型版本
└─ 与OpenAI o1竞争
└─ 成本优势巨大8.5.2 为什么叫“DeepSeek”?
8.5.3 DeepSeek 公司的背景
创始人和融资
公司规模和位置
8.5.4 DeepSeek 的战略选择
选择 1:开源而非闭源
选择 2:专注于效率而非规模
选择 3:推理与基础模型并行
8.5.5 DeepSeek 的成功指标
性能对标
用户采纳
8.5.6 DeepSeek 与中国 AI 生态的关系
中国 AI 的现状
地缘政治的考量
8.5.7 DeepSeek 的商业模式
如何盈利(虽然开源)?
为什么这个模式可行?
8.5.8 本节小结
8.5.9 思考题
最后更新于
