10.1 Token 计费原理

在 AI 时代，Token 就是新的电力。理解 Token 的计费逻辑，是每一位 AI 工程师的基本功。这直接决定了商业模式是否成立。

10.1.1 什么是 Token？

Token 并不等同于单词（Word）或字符（Character）。它是 LLM 处理文本的最小颗粒。

英文: 1 Token ≈ 0.75 单词。 "Apple" = 1 token.
中文: 1 Token ≈ 0.5 - 0.7 汉字。由于 UTF-8 编码，中文通常比英文消耗更多 Token。
- “你好” ≈ 3-4 Tokens。
- “人工智能” ≈ 4-6 Tokens。

实战测试: 可以使用官方的 Tokenizer 工具或 Python 库来精确计算。

10.1.2 计费公式

Anthropic 的计费通常分为两部分： $\text{Total Cost} = (\text{Input Tokens} \times P_{in}) + (\text{Output Tokens} \times P_{out})$

通常 $P_{out}$ (生成) 的价格是 $P_{in}$ (阅读) 的 3-5 倍。 这意味着:

读文档很便宜。
写文章很贵。

10.1.3 三档模型成本对比 (2026 参考价)

虽然具体价格会变动，但相对比例通常保持稳定。以 Haiku 单位 (HU) 来表示相对成本。

模型

Input Cost

Output Cost

性能定位

相对成本

Claude 4.5 Haiku

$1.00 / MTok

$5.00 / MTok

极速、轻量

1x (基准)

Claude 4.6 Sonnet

$3.00 / MTok

$15.00 / MTok

均衡、SOTA

Claude 4.6 Opus

$5.00 / MTok

$25.00 / MTok

深度推理

结论:

Opus 4.6 相比前代大幅降价，现在仅比 Haiku 贵 5 倍。
虽差距缩小，但在大规模并发场景下，成本差异依然显著。

10.1.4 隐藏成本

在计算 ROI 时，除了 API 费用，还要考虑：

思维链消耗 (CoT Overhead): 为了提高准确率，常让模型 “Think step by step”。这会产生额外的 500-1000 Output Tokens。
错误重试 (Retry): Agent 运行失败重试的成本。
Context 膨胀: 多轮对话中，历史记录越来越长，每一轮的 Input Cost 都在指数级增长。

10.1.5 成本计算案例：客服机器人

假设一个客服机器人平均每天接待 1000 人，每人对话 10 轮。

平均每轮 Input (含历史): 2000 Tokens (RAG + History).
平均每轮 Output: 200 Tokens.

使用 Sonnet: $1000 \times 10 \times (2000 \times 3 + 200 \times 15) / 1,000,000 = \$90 / \text{day}$ 年成本: $32,850。

使用 Haiku: $1000 \times 10 \times (2000 \times 1.00 + 200 \times 5.00) / 1,000,000 = \$30 / \text{day}$ 年成本: $10,950。

策略: Haiku 相比 Sonnet 能节省 66% 的成本。因此对于简单问题，要优先考虑 Haiku 模型。

10.1.6 批量处理 (Batch API)

如果在做离线数据分析（如：每晚处理 10,000 份新上传的无格式 PDF 合同，提取关键条款），实时响应是不必要的。为了大幅降低这类大规模并发场景的成本，Anthropic 提供了 Message Batch API。

计费优势：相比常规实时 API，Batch API 通常可提供高达 50% 的成本折扣。
工作机制：将数万个请求打包成一个 .jsonl 文件上传。系统会在 24 小时内异步处理完毕，供你下载结果文件。
适用场景：大规模文档翻译、语料库标注、历史数据清洗、Evals 批量测试评分。

由于 Input Token 往往占据成本的大头（尤其是 RAG 场景），Anthropic 推出了一项革命性技术——Prompt Caching，来解决这个问题。

➡️ Prompt Caching 提示缓存

上一页第十章成本优化与性能调优下一页10.2 提示缓存

最后更新于1天前

hashtag10.1.1 什么是 Token？

hashtag10.1.2 计费公式

hashtag10.1.3 三档模型成本对比 (2026 参考价)

hashtag10.1.4 隐藏成本

hashtag10.1.5 成本计算案例：客服机器人

hashtag10.1.6 批量处理 (Batch API)