12.1 什么是智能体?

12.1.1 定义:有手有脚的 AI

在大语言模型(LLM)被发明之前,我们也有“智能体”的概念(如扫地机器人)。但在 LLM 时代,智能体特指 以大语言模型为大脑,具备感知、规划和行动能力的系统

公式:智能体(Agent) = LLM(大脑)+ Planning(规划)+ Memory(记忆)+ Tools(工具)

  • 大脑(LLM):负责思考、理解意图、决策。详见第六章

  • 规划(Planning):把大目标拆解成小步骤。详见本章第二节ReAct 模式。

  • 记忆(Memory):记住之前的对话、经验和知识。

  • 工具(Tools):也叫手脚。比如浏览器(查信息)、代码解释器(算数)、API(订票)。

在工程实践里,工具接入越来越强调 标准协议(例如 MCP 这类上下文与工具连接协议)。 好处是:一个智能体框架接好的工具,更容易迁移到另一个框架,降低重复开发成本。

12.1.2 为什么智能体是未来?

目前的 Chatbot 有两个大问题:

  1. 幻觉:不知道的瞎编。

  2. 行动力缺失:只能输出文字,无法改变现实世界。

近年的智能体不再只是单打独斗,而更像是 “团队作业”。通过多智能体协作(Multi-Agent Collaboration),它们能处理更复杂的任务。

不少行业领袖都提出过类似判断:AI 智能体(AI Agent)可能会显著改变软件形态,未来用户更像是在“交代任务”,而不是逐个操作 App。

12.1.3 生活中的例子

举例:旅行代理智能体(Agent)

你对它说:“帮我订下周去三亚的机票和酒店,预算 5000。”

一个普通的 Chatbot 会说: “你可以去携程或去哪儿网看看...”

一个智能体(Agent)会做

  1. 思考:先查下周具体日期,再查三亚天气,然后搜索机票价格。

  2. 行动:调用日历 API 确认日期 -> 调用天气 API -> 调用机票搜索 API。

  3. 反馈:发现直飞太贵,转机便宜。

  4. 决策:根据预算选择转机方案。

  5. 最终回复:“已为你找到方案:周三上午吉祥航空,酒店是亚龙湾某某,总价 4800。需要我下单吗?”

这就是差异。

12.1.4 思考题

在你最常见的一个工作场景里,如果引入“能调用工具的智能体”,它最先应该替你完成哪一步?

最后更新于