12.1 什么是智能体?
12.1.1 定义:有手有脚的 AI
在大语言模型(LLM)被发明之前,我们也有“智能体”的概念(如扫地机器人)。但在 LLM 时代,智能体特指 以大语言模型为大脑,具备感知、规划和行动能力的系统。
公式:智能体(Agent) = LLM(大脑)+ Planning(规划)+ Memory(记忆)+ Tools(工具)
大脑(LLM):负责思考、理解意图、决策。详见第六章。
记忆(Memory):记住之前的对话、经验和知识。
工具(Tools):也叫手脚。比如浏览器(查信息)、代码解释器(算数)、API(订票)。
在工程实践里,工具接入越来越强调 标准协议(例如 MCP 这类上下文与工具连接协议)。 好处是:一个智能体框架接好的工具,更容易迁移到另一个框架,降低重复开发成本。
12.1.2 为什么智能体是未来?
目前的 Chatbot 有两个大问题:
幻觉:不知道的瞎编。
行动力缺失:只能输出文字,无法改变现实世界。
近年的智能体不再只是单打独斗,而更像是 “团队作业”。通过多智能体协作(Multi-Agent Collaboration),它们能处理更复杂的任务。
不少行业领袖都提出过类似判断:AI 智能体(AI Agent)可能会显著改变软件形态,未来用户更像是在“交代任务”,而不是逐个操作 App。
12.1.3 生活中的例子
举例:旅行代理智能体(Agent)
你对它说:“帮我订下周去三亚的机票和酒店,预算 5000。”
一个普通的 Chatbot 会说: “你可以去携程或去哪儿网看看...”
一个智能体(Agent)会做:
思考:先查下周具体日期,再查三亚天气,然后搜索机票价格。
行动:调用日历 API 确认日期 -> 调用天气 API -> 调用机票搜索 API。
反馈:发现直飞太贵,转机便宜。
决策:根据预算选择转机方案。
最终回复:“已为你找到方案:周三上午吉祥航空,酒店是亚龙湾某某,总价 4800。需要我下单吗?”
这就是差异。
12.1.4 思考题
在你最常见的一个工作场景里,如果引入“能调用工具的智能体”,它最先应该替你完成哪一步?
最后更新于
