> For the complete documentation index, see [llms.txt](https://yeasy.gitbook.io/claude_guide/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://yeasy.gitbook.io/claude_guide/di-si-bu-fen-shi-zhan-pian/11_safety/11.3_privacy.md).

# 11.3 数据隐私与合规：Data Privacy 与 Compliance

在将 AI 引入生产环境之前，CTO 和法务部门最关心的问题通常不是“它够不够聪明”，而是“它会不会泄密”。本节将详细介绍 Anthropic 的数据政策以及企业级隐私保护最佳实践。

## 11.3.1 商业数据归属权

Anthropic 当前文档将 **API / 商业条款**、**Claude Code** 和 **消费者产品** 区分处理。对 Team、Enterprise、API、第三方平台和 Claude Gov 等商业用户，Anthropic 不会使用在商业条款下提交给 Claude Code 的代码或提示词训练生成式模型，除非客户明确选择加入模型改进计划。普通消费者账号则由用户在隐私设置中选择是否允许数据用于模型改进。

这意味着企业评估时不能只问“Claude 会不会训练我的数据”，而要明确产品形态：API、Claude Code、Claude Enterprise、Claude.ai 消费者账号、第三方云平台和 Managed Agents 的保留策略并不完全相同。

## 11.3.2 数据留存期

虽然不用于训练，但不同 API 和功能有不同的保留需求，不能统一写成一个固定天数：

* **标准 Messages API / Token Counting**：可纳入 Zero Data Retention（ZDR）安排；在 ZDR 下，响应返回后客户数据不在静态存储中保留，除非法律或反滥用需要。
* **Claude Code 商业使用**：使用商业组织 API key 或通过 Claude Enterprise 时可适用 ZDR；消费者账号的 Claude Code 数据保留取决于隐私设置。
* **Claude Code 本地缓存**：客户端默认会在本机 `~/.claude/projects/` 以明文保存 session transcript 以支持恢复，可通过配置调整保留期。
* **非 ZDR 功能**：Batch API、Files API、code execution、Managed Agents 等有各自的存储或状态需求。例如 Batch API 需要异步存储，Managed Agents 是有状态资源，不能自动套用 Messages API 的 ZDR 假设。
* **Mythos-class / Covered Models**：Fable 5、Mythos 5 及后续同级覆盖模型要求 30 天安全留存，不能假设适用 ZDR；敏感场景上线前必须逐模型、逐平台核对 eligibility。

## 11.3.3 合规性认证

Anthropic 平台具备多项合规资质。评估时应区分“认证与鉴证”和“法规符合性”两类（以 [Anthropic Trust Center](https://trust.anthropic.com) 为准）：

**认证与鉴证**：

* **SOC 2 Type II**: 独立审计出具的鉴证报告，证明其在安全性、可用性、保密性方面的控制措施有效。
* **ISO 27001:2022**: 信息安全管理体系认证。
* **ISO/IEC 42001:2023**: AI 管理体系认证。

**法规符合性（非认证）**：

* **HIPAA**: 通过签署 BAA 支持符合美国医疗数据保护法案的使用场景（HIPAA 本身并无官方认证机制）。
* **GDPR**: 符合欧盟通用数据保护条例。
* **CCPA**: 符合加州消费者隐私保护法案。

对于需要在特定地区运营的企业，应按具体产品、feature、合同、DPA、子处理方、日志和支持流程核对数据驻留边界。不要把“区域化部署”简化为所有链路天然不跨境；Claude.ai、API、Claude Code、Managed Agents、Files、code execution 和第三方连接器的覆盖范围可能不同。

## 11.3.4 最佳实践：企业级数据处理

### 数据最小化

只发送 LLM 解题必须的数据。

* *Bad*: 发送整个 User Profile JSON 对象（包含地址、电话、信用卡号）。
* *Good*: 只发送 `{"user_name": "Alice", "recent_purchase": "Book"}`。

### 本地匿名化

在数据离开私有云（Private VPC）之前，对其进行脱敏。 使用 **Faker** 或哈希算法：

* `Alice Smith` -> `User_A7B2`
* `192.168.1.1` -> `[IP_ADDRESS]`

当 Claude 返回结果后，再在本地进行 **反向替换 (De-anonymization)**，还原出真实信息呈现给用户。这样，真实的 PII 永远不会离开内网。

**示例代码**：

```python
import re

PII_PATTERNS = {
    r'\b\d{3}-\d{2}-\d{4}\b': '[SSN]',  # 社会安全号
    r'\b\d{16}\b': '[CREDIT_CARD]',      # 信用卡号
    r'[\w\.-]+@[\w\.-]+': '[EMAIL]',     # 电子邮件
}

def anonymize(text):
    for pattern, placeholder in PII_PATTERNS.items():
        text = re.sub(pattern, placeholder, text)
    return text
```

### 审计日志

记录每一次 LLM 调用的元数据（Metadata），但不记录 Payload。

* Who: 哪个员工调用的？
* When: 时间戳。
* Cost: 消耗了多少 Token？
* Subject: 大致主题是什么（由分类器打标，而非原文）。

### 访问控制

实施基于角色的访问控制（RBAC），确保只有授权人员可以访问 Claude API：

* 开发环境使用独立的 API Key
* 生产环境的 Key 存储在 Secret Manager 中
* 定期轮换 API Key

***

安全和隐私是底线。但作为 AI 开发者，还要承担更高的社会责任。 AI 是否有偏见？AI 是否会剥夺工作机会？如何构建一个 **负责任** 的 AI 系统？

➡️ [负责任的 AI 应用](/claude_guide/di-si-bu-fen-shi-zhan-pian/11_safety/11.4_responsible.md)
