9.1 智能体架构与上下文

9.1.1 智能体的定义

AI 智能体是一个能够感知环境、做出决策并采取行动以实现特定目标的自主系统。相较于单次对话的 LLM 应用，智能体具有以下特征：

自主性：能够独立规划和执行任务
持续性：在多个步骤中持续工作
工具使用：能够调用外部工具扩展能力
环境交互：能够感知和影响环境

9.1.2 智能体的基本架构

现代智能体通常由六个核心模块组成，以 LLM 为中心协调运作：

核心模块说明：

LLM 核心：智能体的"大脑"，负责理解、推理和决策。所有其他模块都围绕 LLM 进行信息交互
感知模块：接收并处理多模态输入（文本、图像、音频等），将外部信息转化为 LLM 可理解的格式
规划模块：将复杂任务分解为可执行的子任务，制定行动计划。支持动态调整和重规划
执行模块：根据规划调用工具、执行操作，将决策转化为实际行动
工具模块：提供外部能力扩展，包括 API 调用、代码执行、数据检索等。通过 MCP 等协议实现标准化集成
记忆模块：管理短期工作记忆和长期持久记忆，提供上下文连续性和知识积累
反思模块：评估执行结果，分析成功与失败，生成改进建议。支持自我纠错和持续学习

运行循环：

智能体遵循"感知 → 规划 → 执行 → 观察 → 反思"的循环：

感知模块接收输入和环境观察
LLM 理解当前状态，规划模块制定行动计划
执行模块调用工具模块执行操作
工具返回结果，反馈到感知模块
反思模块评估结果，必要时将经验存入记忆模块

9.1.3 上下文在智能体中的角色

上下文是智能体运作的核心：

角色

说明

任务定义

描述智能体的目标和约束

环境状态

当前环境的相关信息

执行历史

已采取的行动和结果

规划状态

当前的计划和进度

可用工具

智能体可调用的工具

9.1.4 智能体上下文的特殊挑战

相较于普通对话，智能体面临更复杂的上下文挑战：

长程依赖：智能体任务可能跨越数十轮甚至数百轮交互，需要保持对早期信息的记忆
状态管理：需要追踪复杂的状态，包括任务进度、环境变化、中间结果等
多源信息：信息来源多样，包括用户输入、工具返回、环境观察、历史回顾等
动态调整：计划可能需要根据执行情况动态调整，上下文需要反映这些变化

9.1.5 智能体上下文的典型结构

┌─────────────────────────────────┐
│         智能体定义层            │
│  角色、能力、工具、约束         │
├─────────────────────────────────┤
│         任务层                  │
│  当前任务、目标、成功标准       │
├─────────────────────────────────┤
│         状态层                  │
│  当前进度、环境状态、计划       │
├─────────────────────────────────┤
│         历史层                  │
│  执行记录、观察结果、决策过程   │
├─────────────────────────────────┤
│         交互层                  │
│  当前步骤、即时输入             │
└─────────────────────────────────┘

9.1.6 ReAct 模式

ReAct 是常见的智能体运行模式：

思考 (Reason) → 行动 (Act) → 观察 (Observe) → 思考 → ...

上下文需要记录这个循环的每一步：

Thought: 我需要先查询用户的订单信息
Action: query_orders(user_id="123")
Observation: [订单列表...]
Thought: 找到了3个待处理订单，需要逐一处理
Action: process_order(order_id="001")
...

ReAct vs Reflexion：

维度

ReAct

Reflexion

核心机制

交替进行推理和行动

执行后进行自我反思和改进

反馈时机

每步行动后获得环境观察

任务完成后评估整体结果

学习方式

即时调整下一步行动

将经验教训存入长期记忆

上下文需求

记录 Thought-Action-Observation 轨迹

额外存储 Self-Reflection 和历史失败案例

适用场景

需要实时交互的任务

需要从失败中学习的复杂任务

两种模式可以结合使用：用 ReAct 执行任务，用 Reflexion 在任务结束后总结经验。

9.1.7 上下文管理的核心原则

1. 信息分层

按重要性和时效性分层管理。智能体的上下文应该有清晰的层级结构：系统级定义最稳定、任务级目标相对固定、状态信息需要持续更新、历史记录可以压缩或淘汰。不同层级采用不同的保留策略和更新频率。

2. 动态更新

随任务进展更新状态信息。智能体执行过程中，环境在变化、进度在推进、计划可能调整。上下文必须反映这些变化，否则智能体将基于过时信息做出错误决策。建立清晰的状态更新机制，确保关键信息及时同步。

3. 选择性保留

保留关键信息，压缩或丢弃冗余。长程任务会产生大量历史信息，不可能全部保留。需要智能地选择：哪些是关键结论必须保留？哪些是过程细节可以压缩？哪些是临时信息可以丢弃？这需要根据任务类型设计合理的淘汰策略。

4. 结构化组织

清晰的结构便于规划和推理。杂乱的上下文会让模型迷失方向。使用明确的标签和分区组织不同类型的信息，让模型能快速定位需要的内容。良好的结构不仅提高效率，也减少模型的理解错误。

9.1.8 长任务上下文管理策略

对于跨越数十分钟到数小时的长期任务（Long-horizon Tasks），智能体面临持续的上下文管理挑战。以下介绍两种核心策略：

Just-in-time 上下文策略

核心理念：只在需要时加载信息，而非预先加载所有可能需要的内容。

实现方式：

使用工具在执行时读取文件，而非在系统提示中预加载
按需从知识库拉取专题信息
利用代码索引定位相关函数，而非包含整个代码库

效果：

避免上下文过早填满
确保信息的时效性（总是读取最新版本）
减少信息干扰

Hybrid 混合检索策略

结合语义搜索和关键词搜索，解决单一检索方式的局限。

问题：

纯语义搜索：对特定标识符（如 error_code_123）效果差
纯关键词搜索：无法理解语义相似性

解决方案：

def hybrid_retrieve(query, documents):
    # 语义搜索：理解意图
    semantic_results = semantic_search(query, documents, top_k=10)
    
    # 关键词搜索：精确匹配
    keyword_results = keyword_search(query, documents, top_k=10)
    
    # 混合排序：综合两者优势
    return rerank(semantic_results, keyword_results)

适用场景：

技术文档查询（需要同时匹配概念和代码标识）
代码库搜索（函数名 + 功能描述）
混合结构化与非结构化数据的知识库

策略选择指南

策略

适用场景

Just-in-time

上下文需求不可预测、文件频繁变化

Hybrid 检索

知识库混合技术术语和自然语言

Compaction

需要大量来回交互的任务

Structured Note-taking

有明确里程碑的迭代开发

Previous第九章：智能体上下文管理 Next9.2 单智能体上下文管理

Last updated 1 day ago

hashtag9.1.1 智能体的定义

hashtag9.1.2 智能体的基本架构

hashtag9.1.3 上下文在智能体中的角色

hashtag9.1.4 智能体上下文的特殊挑战

hashtag9.1.5 智能体上下文的典型结构

hashtag9.1.6 ReAct 模式

hashtag9.1.7 上下文管理的核心原则

hashtag9.1.8 长任务上下文管理策略

hashtagJust-in-time 上下文策略

hashtagHybrid 混合检索策略

hashtag策略选择指南