> For the complete documentation index, see [llms.txt](https://yeasy.gitbook.io/claude_guide/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://yeasy.gitbook.io/claude_guide/fu-lu/12_appendix/12.5_pricing.md).

# 附录 E：Claude 定价与成本参考

> **免责声明**：AI 模型定价调整频繁，本文档数据仅供参考。本附录针对 API 按 Token 计费的预算，做预算决策时，**必须** 以 [Anthropic 官方 API 定价文档](https://platform.claude.com/docs/en/about-claude/pricing) 为准（与附录 G 的定价权威入口一致）；批处理、缓存、数据驻留和托管平台价格也需要按官方文档或合同条款单独确认。

***

## 12.5.1 计费模式概览

Claude API 主要采用 **Pay-as-you-go (按用量付费)** 模式，计费单位为 **每百万 Token (Per Million Tokens, PMT)**。

### 核心计费项

1. **输入 Token (Input Tokens)**：你发送给模型的文字、图片、文档。
2. **输出 Token (Output Tokens)**：模型生成的回复内容。通常输出 Token 的单价远高于输入 Token（约为 3-5 倍）。
3. **提示缓存写入 (Prompt Caching Write)**：将常用 Context 存入缓存时的费用（通常比普通输入略贵）。
4. **提示缓存读取 (Prompt Caching Read)**：复用缓存内容时的费用（通常只有普通输入的 10% 甚至更低，这是 **省钱的关键**）。

***

## 12.5.2 模型定价参考表

| 模型系列                  | 输入 (Input) / PMT | 输出 (Output) / PMT | 缓存读取 (Read) / PMT | 适用场景                                                      |
| --------------------- | ---------------- | ----------------- | ----------------- | --------------------------------------------------------- |
| **Claude Fable 5**    | $10.00           | $50.00            | $1.00             | 发布价格快照（2026-06-09 GA）；2026-06-12 起访问暂停                    |
| **Claude Haiku 4.5**  | $1.00            | $5.00             | $0.10             | 高并发日志分析、简单分类、翻译                                           |
| **Claude Sonnet 4.6** | $3.00            | $15.00            | $0.30             | 代码生成、复杂推理、通用 Agent                                        |
| **Claude Opus 4.8**   | $5.00            | $25.00            | $0.50             | 最复杂研究、长程代理式编码、高自治任务                                       |
| **Claude Opus 4.7**   | $5.00            | $25.00            | $0.50             | 软件工程、复杂代码库分析、系统设计; 新 tokenizer 导致实际消耗 1.00-1.35 倍 token\* |
| **Claude Opus 4.6**   | $5.00            | $25.00            | $0.50             | 极端复杂的创意写作、科研推理                                            |

> 💡 **提示（核验日期：2026-06-17，来源：Anthropic models/pricing 页与 Fable/Mythos access statement）**：Sonnet 的性价比通常使得它成为大多数生产环境的默认选择。Opus 4.8 与 Opus 4.7/4.6 处于相同标准单价档；Opus 档 5m 缓存写入为 $6.25/PMT，1h 缓存写入为 $10/PMT，缓存读取为 $0.50/PMT。Fable 5 按同样倍率推算为 $12.50（5m 写）/$20（1h 写）/$1.00（读），但 2026-06-12 起访问暂停。Opus 4.7 起的新 tokenizer 可能增加实际 token 消耗 1.00-1.35 倍（Fable 5 沿用该 tokenizer），历史迁移仍需在实际应用中监控成本变化。
>
> *Opus 4.8 是当前 Opus 旗舰；Opus 4.7 的 SWE-bench Verified 87.6% 和 GPQA Diamond 94.2% 是该版本发布时的历史指标。*

***

## 12.5.3 成本估算示例

### 场景 A：代码审查助手

* **任务**：每天审查 100 次代码提交，每次提交平均 2000 Tokens (输入)，模型回复 500 Tokens (输出)。
* **模型**：Claude Sonnet 4.6
* **计算**：
  * 输入日成本：100 \* 2000 / 1,000,000 \* $3.00 = $0.60
  * 输出日成本：100 \* 500 / 1,000,000 \* $15.00 = $0.75
  * **每日总计**：$1.35
  * **每月总计**：\~$40.00

### 场景 B：海量文档归档：使用 Haiku + Caching

* **任务**：分析 1000 份合同，每份合同 50k Tokens。其中 40k Tokens 是通用的法律条款模板 (可缓存)。
* **模型**：Claude Haiku 4.5
* **计算 (未缓存)**：1000 \* 50k / 1m \* $1.00 = $50.00
* **计算 (使用缓存)**：
  * 缓存写入 (1次)：40k / 1m \* $1.25 (假设写入价) = $0.05
  * 缓存读取 (999次)：999 \* 40k / 1m \* $0.10 ≈ $4.00
  * 差异内容 (1000次)：1000 \* 10k / 1m \* $1.00 = $10.00
  * **总计**：\~$14.05 (**节省约 70%**)


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://yeasy.gitbook.io/claude_guide/fu-lu/12_appendix/12.5_pricing.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
