本章小结

本章跨越了大型语言模型(LLM)最重要的分水岭:从“被动问答”进化为“主动代理”。通过掌握工具使用(Tool Use),Claude 不再被禁锢在预训练的文本框中,而是获得了感知世界、操纵数据和执行任务的“双手”。

核心知识点回顾

工具的本质

工具不仅仅是 API 调用,更是 Claude 逻辑推理能力的延伸

  • 客户端工具:你掌握控制权,Claude 负责意图识别和参数生成。

  • 服务端工具:Anthropic 提供的开箱即用能力(如联网搜索)。

定义的力量

  • Description is Prompt:工具描述是系统提示词的一部分,决定了调用的准确率。

  • JSON Schema:精确的参数类型定义(Enum, Required, Format)是防止幻觉的第一道防线。

请-算-行-馈

我们深入剖析了 Agent 运行的生命周期:

  1. Stop Reason: 识别 tool_use 信号。

  2. Execution: 并行或串行执行业务逻辑。

  3. Result: 构造包含 Text 或 Image 的 tool_result

  4. History: 维护完整的对话链条是成功的关键。

复杂编排

  • 并行模式:利用 asyncio 降低多工具调用的延迟。

  • 人机协作 (HITL):在关键操作前引入人工审批,确保安全。

  • 状态管理:学会区分哪些状态属于 Context,哪些属于外部数据库。

高级特性

  • 程序化工具调用:让 Claude 写代码而不是发 JSON,极大提升了处理复杂逻辑和大量数据的效率。

  • 工具搜索:通过“按需加载”机制,解决了 Token 限制与大规模工具库之间的矛盾,为构建拥有成千上万技能的超级 Agent 铺平了道路。

开发者自检清单

在开始构建你的 Agent 之前,请通过以下问题自检:

下一站:标准化连接

虽然我们已经学会了如何定义工具,但在现实世界中,连接不同的数据源(Google Drive, Slack, PostgreSQL)往往涉及繁琐的适配工作。

有没有一种通用的标准,让我们能像插 USB 设备一样,即插即用地扩展 Claude 的能力?

答案就是 MCP (Model Context Protocol)

➡️ 进入第 4 章:MCP 模型上下文协议

最后更新于