> For the complete documentation index, see [llms.txt](https://yeasy.gitbook.io/claude_guide/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://yeasy.gitbook.io/claude_guide/di-yi-bu-fen-ji-chu-pian/01_intro/1.3_capabilities.md).

# 1.3 Claude 能做什么：六大核心能力

很多人初次接触 AI 时，往往只把它们当作聊天机器人。这就像是买了一台超级计算机却只用它来玩扫雷。Claude 不仅仅是一个会说话的程序，它是一个 **多模态的智能代理系统 (Multimodal Intelligent Agent)**。

在 2026 年的视角下，Claude 的能力版图可以概括为六大核心支柱。

## 1.3.1 文本理解与生成

这是 Claude 的基本功，但它不仅限于“写文章”。

* **长文档分析 (Long-context Understanding)**： Claude Opus 5、Sonnet 5、Fable 5 和 Opus 4.8/4.7/4.6 支持 1M Token 上下文窗口；Sonnet 4.6 保留为迁移期兼容性基线。Fable 5 已于 2026-07-01 恢复全球访问。Haiku 4.5 通常为 200K。实际可用窗口还可能受平台限制；即使使用长上下文模型，处理大代码库、数百份财报、法律文书或技术白皮书时仍需要配套检索、分块和摘要策略。

  > *示例*：上传 10 份竞品的年报，让 Claude 生成一份横向对比的财务分析表格。
* **细微语境捕捉 (Nuance)**： Claude 以“文笔细腻”著称。它能精准捕捉文字背后的情感色彩、讽刺意味或文化隐喻。这使得它在文学创作、公关稿撰写和情感陪伴场景下表现优异。
* **多语言翻译**： 它不是简单的词对词翻译，而是基于语义的“本地化”。它能处理日语的敬语、中文的成语以及编程领域的专业术语。

## 1.3.2 代码生成与工程

对于开发者来说，Claude 已经是公认的 **最强编程模型** 阵营——口碑自 4.5/4.6 系列奠定，如今由 Opus 4.7/4.8 延续；Fable 5 的发布规格更高，但生产可用性需按官方模型页重新核验。

* **全栈开发**：从 React 前端组件到 Python 后端 API，再到 Dockerfile 和 Kubernetes 配置，Claude 能编写可运行的完整代码片段。
* **遗留代码重构**：扔给它一段没有注释、变量名混乱的 10 年前的 Java 代码，它可以分析逻辑、添加注释，并将其重构为现代的 Kotlin 语法。
* **Artifacts 实时预览**： 这是 Claude 最具杀伤力的特性。当要求“写一个贪吃蛇游戏”或“画一个销售漏斗图”时，它生成的 HTML/JS 代码会直接在侧边栏渲染成可交互的应用。无需复制粘贴代码到本地运行，所见即所得。
* **Claude Design（2026-04-17，研究预览）**： Anthropic Labs 推出的视觉设计协作工具，基于 Opus 4.7 驱动。用户通过自然语言描述需求，Claude 即可生成海报、原型图、幻灯片等视觉设计稿，并支持对话式迭代修改。成品可导出为 PDF、PPTX、HTML 或分享给团队。

## 1.3.3 视觉与多模态

Claude 拥有极强的“眼睛”。

* **图表转数据**：上传一张复杂的柱状图或销售仪表盘截图，Claude 可以直接将其转化为 JSON 数据或 Markdown 表格。
* **UI/UX 设计辅助**：给它看一张手绘的网页草图，它可以直接生成对应的 HTML/Tailwind CSS 代码。
* **视觉问答**：拍一张冰箱里食材的照片，问它“今晚能做什么菜？”，或者拍一张报错的电脑屏幕，问它“这是什么错误？”。

## 1.3.4 工具使用

这是 Claude 走出“聊天框”，连接现实世界的桥梁。 这一点在[第三章](/claude_guide/di-er-bu-fen-gong-ju-pian/03_tools.md)有详细讲解，这里简要概述：

通过 Tool Use，Claude 可以：

* **实时联网**：调用 Web Search / Web Fetch 或自定义搜索工具获取当前网页信息。
* **操作业务系统**：连接 CRM 查询客户资料，连接 Jira 创建工单。
* **精准计算**：遇到复杂数学题，自动调用 Python 代码进行计算，而不是瞎猜。

## 1.3.5 计算机操控

这被认为是 **Agentic AI (代理式 AI)** 的终极形态之一。

在 2024 年底，Anthropic 赋予了 Claude 直接控制鼠标和键盘的能力。

* **工作原理**：Claude 像人类一样“看”屏幕截图，计算出“应该点击坐标 (x, y)”，并发送指令给虚拟桌面。
* **应用场景**：
  * **在旧软件上工作**：很多企业内部系统没有 API，只有古老的 Windows 界面。Claude 可以像人一样点击菜单、输入数据、导出报表。
  * **跨应用工作流**：从 Excel 复制数据 -> 打开浏览器 -> 登录后台 -> 填表提交。这种跨越多个 GUI 软件的流程，以前很难自动化，现在 Claude 可以轻松搞定。

## 1.3.6 技能系统

Skills 是 Claude 生态的最新拼图。它解决的是“复用性”问题。

如果你教会了 Claude “如何撰写符合公司规范的周报”，由于 Context 会重置，下次还得重教一遍。 **Skills** 允许你将这套指令（Prompt + 相关资料 + 示例）打包成一个“技能包”。

* 当在 Claude.ai 或企业版中使用时，系统会根据请求自动挂载相关的 Skill。
* 这相当于给 Claude 安装了“插件”，让它瞬间变成“资深法务”、“专业会计”或“Python 专家”。

***

## 1.3.7 能力分布雷达图

为了更直观地展示这六大能力如何构成完整的智能系统，请看 Claude 的能力图谱：

```mermaid
graph LR
    %% Styles
    classDef core fill:#E65100,stroke:#333,stroke-width:3px,color:white,font-weight:bold;
    classDef branch fill:#FFECB3,stroke:#FF6F00,stroke-width:2px,color:#333;
    classDef node fill:#FFF8E1,stroke:#FFB300,stroke-width:1px,color:#333;

    %% Nodes
    Root(("Claude")):::core

    %% Branch 1
    Root --> B1("基础认知"):::branch
    B1 --> N1["文本理解<br>1M Context"]:::node
    B1 --> N2["视觉能力<br>Vision"]:::node

    %% Branch 2
    Root --> B2("专业技能"):::branch
    B2 --> N3["全栈编程<br>Coding"]:::node
    B2 --> N4["技能系统<br>Skills"]:::node

    %% Branch 3
    Root --> B3("外部行动"):::branch
    B3 --> N5["工具调用<br>Tool Use"]:::node
    B3 --> N6["电脑操控<br>Computer Use"]:::node
```

## 1.3.8 边界：Claude 做不到什么？

诚实是 Claude 的核心价值观之一。了解它的局限同样重要：

* **它没有长期记忆**：除非使用专门的 Memory 功能或外挂数据库，否则它记不住历史对话内容。
* **它不会主动行动**：Claude 本质上是被动的。若不发消息，它永远不会主动发送早安（除非写了一个定时脚本去触发它）。
* **它是概率模型**：在极少数情况下，它仍可能产生幻觉（Hallucination）——输出看似流畅但事实内容错误。幻觉往往出现在模型“不熟悉”的领域（训练数据稀疏的方向）。对于医疗、法律建议，务必进行人工核实。关于幻觉产生的底层机制（信号空间 vs 零空间），参见姊妹篇《大模型原理与架构》14.9.4 节。

***

了解了 Claude 的强大能力，可能会产生“选择困难症”：这么多模型，该用哪一个？Opus 虽好，但会不会太贵？

➡️ [如何选择合适的模型](/claude_guide/di-yi-bu-fen-ji-chu-pian/01_intro/1.4_model_selection.md)