11.2 反馈循环与人机协同设计

AI Agent 系统的可靠性关键在于与人类的有效协作。本节介绍反馈循环设计、人在环(HITL)模式、审批工作流、权限解释机制和 Ask-First 机制,确保 Agent 的关键决策获得人类监督。

11.2.1 HITL模式

HITL 流程图

人在环决策的核心流程如下:

图 11-2:人在环决策流程

风险评估模块

风险评估模块的核心实现: 风险评估器使用加权因子模型来量化操作的风险等级。首先定义数据结构和因子权重:

风险评估器的内部评分方法包括敏感性、财务影响和不可逆性评估:

11.2.2 审批工作流

审批工作流通过状态机管理请求的生命周期。首先定义审批请求的数据结构:

审批工作流管理器提供创建、批准、拒绝和查询请求的操作:

11.2.3 权限解释器

权限解释器使用 LLM 来理解用户的自然语言权限声明:

使用示例展示如何解释不同的权限声明:

11.2.4 OpenClaw Ask-First 模式

Ask-First 权限模型实现了 6 级信任框架。权限管理器跟踪用户的决策并根据时间或上下文变化重新询问:

Ask-First 对话模块负责生成询问提示和解析用户响应:

11.2.5 用户反馈采集

反馈系统收集用户对 Agent 操作的评价,并分析改进领域。首先定义反馈数据结构:

11.2.6 实战:完整的 HITL 系统

实现代码如下:

11.2.7 运行时指令注入

前面讨论的反馈机制(审批、Ask-First、反馈采集)都是 预设流程——系统在特定节点等待用户响应。但在长时间运行的 Agent 任务中,用户需要能在 任意时刻 向正在执行的 Agent 发送新指令,而不必等到下一个预设检查点。

指令注入的架构

运行时指令注入通过独立的 控制通道 实现,与 Agent 的数据通道(Think-Act-Observe 循环)并行运行:

安全点与状态一致性

Agent 不能在任意时刻处理注入指令——必须在 安全点 处理,以保证状态一致性:

这种设计确保注入的指令不会破坏 Agent 的中间状态,而是在下一个安全点被优雅地吸收到执行流程中。

11.2.8 总结

反馈循环与人机协同的关键组件:

组件
作用
参考系统

风险评估

量化操作风险

独立设计

HITL 工作流

根据风险级别决定执行方式

独立设计

审批工作流

高风险操作的正式审批

OpenClaw

权限解释

自然语言权限授予

Claude Code

Ask-First

首次询问,后续记忆

OpenClaw

反馈采集

从用户反馈中学习

独立设计

运行时指令注入

执行中接受新指令

控制通道 + 安全点

下一节将介绍容错模式与系统级恢复。

最后更新于