> For the complete documentation index, see [llms.txt](https://yeasy.gitbook.io/claude_guide/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://yeasy.gitbook.io/claude_guide/fu-lu/12_appendix/12.5_pricing.md).

# 附录 E：Claude 定价与成本参考

> **免责声明**：AI 模型定价调整频繁，本文档数据仅供参考。本附录针对 API 按 Token 计费的预算，做预算决策时，**必须** 以 [Anthropic 官方 API 定价文档](https://platform.claude.com/docs/en/about-claude/pricing) 为准（与附录 G 的定价权威入口一致）；批处理、缓存、数据驻留和托管平台价格也需要按官方文档或合同条款单独确认。

***

## 12.5.1 计费模式概览

Claude API 主要采用 **Pay-as-you-go (按用量付费)** 模式，计费单位为 **每百万 Token (Per Million Tokens, PMT)**。

### 核心计费项

1. **输入 Token (Input Tokens)**：你发送给模型的文字、图片、文档。
2. **输出 Token (Output Tokens)**：模型生成的回复内容。通常输出 Token 的单价远高于输入 Token（约为 3-5 倍）。
3. **提示缓存写入 (Prompt Caching Write)**：将常用 Context 存入缓存时的费用（通常比普通输入略贵）。
4. **提示缓存读取 (Prompt Caching Read)**：复用缓存内容时的费用（通常只有普通输入的 10% 甚至更低，这是 **省钱的关键**）。

***

## 12.5.2 模型定价参考表

| 模型系列                         | 输入 (Input) / PMT | 输出 (Output) / PMT | 缓存读取 (Read) / PMT | 适用场景                                                      |
| ---------------------------- | ---------------- | ----------------- | ----------------- | --------------------------------------------------------- |
| **Claude Sonnet 5**          | $2.00            | $10.00            | $0.20             | 介绍价至 2026-08-31；之后标准价 $3.00/$15.00，缓存读取 $0.30             |
| **Claude Fable 5**           | $10.00           | $50.00            | $1.00             | 2026-07-01 恢复全球访问；高风险任务仍需评估分类器拒绝与回退                       |
| **Claude Haiku 4.5**         | $1.00            | $5.00             | $0.10             | 高并发日志分析、简单分类、翻译                                           |
| **Claude Sonnet 4.6（兼容性基线）** | $3.00            | $15.00            | $0.30             | 仅用于既有系统迁移、回归对比或回退预案                                       |
| **Claude Opus 5**            | $5.00            | $25.00            | $0.50             | 当前 Opus 档型号；复杂代理式编码与企业级任务的默认起点                            |
| **Claude Opus 4.8（Legacy）**  | $5.00            | $25.00            | $0.50             | 最复杂研究、长程代理式编码、高自治任务                                       |
| **Claude Opus 4.7**          | $5.00            | $25.00            | $0.50             | 软件工程、复杂代码库分析、系统设计; 新 tokenizer 导致实际消耗 1.00-1.35 倍 token\* |
| **Claude Opus 4.6**          | $5.00            | $25.00            | $0.50             | 极端复杂的创意写作、科研推理                                            |

> 💡 **提示（核验日期：2026-07-26，来源：Anthropic models/pricing、What's new in Opus 5、Sonnet 5 release notes）**：Sonnet 5 的 $2/$10 是截至 2026-08-31 的介绍价，预算必须同时保存标准价 $3/$15 情景。Opus 5 与 Opus 4.8/4.7/4.6 处于相同标准单价档；Opus 5 的 Fast mode（研究预览）按 $10/$50 计费，且仅在 Claude API 上提供；Opus 档 5m 缓存写入为 $6.25/PMT，1h 缓存写入为 $10/PMT，缓存读取为 $0.50/PMT。Fable 5 已恢复全球访问，其 5m 写入/$12.50、1h 写入/$20、读取/$1.00 仍按官方价格表复核。Sonnet 5 新 tokenizer 对同一文本约增加 30% token，不能只比较每 token 单价。
>
> *Opus 5（2026-07-24 发布）是当前 Opus 档型号，Opus 4.8/4.7/4.6 已转入官方 Legacy models 分组，仍可调用；Opus 4.7 的 SWE-bench Verified 87.6% 和 GPQA Diamond 94.2% 是该版本发布时的历史指标。*

***

## 12.5.3 成本估算示例

### 场景 A：代码审查助手

* **任务**：每天审查 100 次代码提交，每次提交平均 2000 Tokens (输入)，模型回复 500 Tokens (输出)。
* **模型**：Claude Sonnet 5（介绍价情景）
* **计算**：
  * 输入日成本：100 \* 2000 / 1,000,000 \* $2.00 = $0.40
  * 输出日成本：100 \* 500 / 1,000,000 \* $10.00 = $0.50
  * **每日总计**：$0.90
  * **每月总计**：\~$27.00（30 天）
  * **标准价情景**：2026-08-31 后按 $3/$15 计，每日 $1.35，30 天约 $40.50

### 场景 B：海量文档归档：使用 Haiku + Caching

* **任务**：分析 1000 份合同，每份合同 50k Tokens。其中 40k Tokens 是通用的法律条款模板 (可缓存)。
* **模型**：Claude Haiku 4.5
* **计算 (未缓存)**：1000 \* 50k / 1m \* $1.00 = $50.00
* **计算 (使用缓存)**：
  * 缓存写入 (1次)：40k / 1m \* $1.25 (假设写入价) = $0.05
  * 缓存读取 (999次)：999 \* 40k / 1m \* $0.10 ≈ $4.00
  * 差异内容 (1000次)：1000 \* 10k / 1m \* $1.00 = $10.00
  * **总计**：\~$14.05 (**节省约 70%**)