本章小结

本章阐述了Harness系统的四大设计原则,以下是核心要点的系统回顾。

四大设计原则的完整体系

本章介绍了构建生产级Harness系统的四大设计原则。这些原则相互补充、形成了一个完整的设计哲学体系:

四大原则的各自职责

1. 约束优先

核心思想:首先定义Agent不能做什么,然后在这个框架内赋予能力。

关键要素

  • 权限维度:可以访问哪些资源

  • 操作维度:禁止哪些操作

  • 时间维度:什么时候允许操作

  • 数据维度:什么样的数据可以处理

实现方法

  • 白名单(最安全)

  • 黑名单(最灵活)

  • 规则引擎(最平衡)

在实践中,Claude Code 通过 protected files 和 dangerous patterns 实现约束优先,OpenClaw 则通过 SOUL.md 约束文档来定义边界。

2. 可验证性

核心思想:系统的每一个操作都应该是可观测的、可追踪的、可重放的。

三个层次

  1. 操作日志:记录发生了什么

  2. 执行追踪:记录操作之间的因果关系

  3. 可重放性:给定相同输入,能够重现执行

关键实现

  • 结构化日志,便于搜索和分析

  • 分布式追踪,显示完整的执行路径

  • 执行重放,验证系统一致性

在实践中,Claude Code 基于 OpenTelemetry 实现分布式追踪,OpenClaw 则通过 Lobster 确定性日志实现执行重放。

3. 渐进信任

核心思想:不要期望一下子完全信任Agent,而是通过观察和学习逐步提升权限。

信任梯度 (从低到高):

  1. Manual Only:完全人工操作

  2. Approve Always:每步审批

  3. Approve Once:任务开始时批准一次

  4. Ask First:关键操作事前询问

  5. Auto with Notification:自动执行并通知

  6. Full Trust:充分信任(罕见)

提升和降级

  • 提升需要明确的证据和标准

  • 降级可以快速响应问题

  • 持续的监控和评估

4. 故障假设

核心思想:主动假设每一步都可能失败,并提前设计失败处理。

故障类型和处理

  • 临时故障 → 重试(Retry)

  • 永久故障 → 降级/回退(Fallback)

  • 部分故障 → 隔离(Bulkhead)

  • 级联故障 → 断路器(Circuit Breaker)

关键机制

  • 指数退避重试,避免羊群效应

  • 检查点和事务,支持中间恢复

  • 持续监控和告警,快速检测故障

四大原则的相互关系

四大原则并非孤立,而是相互支撑的完整体系,如下所示:

实践中的集成应用

这四大原则在实际系统设计中是高度集成的:

设计一个转账系统

约束优先:定义智能体的权限

可验证性:记录每个转账操作

渐进信任:根据Agent表现逐步提升权限

故障假设:为可能的失败设计处理

与前两章的关系

本章与前两章的关系和递进逻辑如下:

MiniHarness中应用这些原则

在MiniHarness项目中,这些原则的应用包括:

MiniHarness中的约束优先

在工具注册表中实现约束优先原则:

MiniHarness中的可验证性

通过结构化日志实现可验证性:

MiniHarness中的渐进信任

实现权限等级管理以支持渐进信任:

MiniHarness中的故障假设

实现容错机制以处理故障场景:

评估清单

在实现一个Harness系统时,检查以下清单来确保所有四大原则都被正确应用:

约束优先检查清单

可验证性检查清单

渐进信任检查清单

故障假设检查清单

常见的误区

误区1:过度约束

问题:为了安全起见,给Agent几乎没有权限。 结果:Agent无法完成任何有意义的工作。 解决:使用渐进信任,逐步扩展权限。

误区2:忽视可验证性

问题:为了性能,不记录详细日志。 结果:出现问题时无法诊断。 解决:记录足够的信息用于调试,但使用异步日志避免性能影响。

误区3:假设不会出现故障

问题:认为系统足够可靠,不需要额外的故障处理。 结果:小故障导致大事件。 解决:主动设计故障处理机制。

误区4:权限一成不变

问题:定义权限后,再也不调整。 结果:权限要么太宽松(安全问题),要么太严格(效率问题)。 解决:根据运行数据定期评估和调整。

与业界最佳实践的对齐

这四大原则与业界的系统工程最佳实践高度对齐:

  • 约束优先 ↔ “白名单优于黑名单”(安全工程)

  • 可验证性 ↔ “日志和追踪”(SRE最佳实践)

  • 渐进信任 ↔ “逐步展开”(DevOps实践)

  • 故障假设 ↔ “混沌工程”(系统可靠性)

总结和后续步骤

本章确立了Harness系统的四大设计原则。这些原则:

  1. 相互补充:组合在一起,形成了一个完整的安全、可靠、可管理的系统

  2. 可操作化:不是抽象的哲学,而是可以具体实现的工程实践

  3. 可度量:每个原则都有具体的指标可以评估

从第4章开始,我们将进入各个子系统的深入实现,而这四大原则将在每个子系统中不断体现。

关键概念回顾表

原则
核心思想
关键实现
检验标准

约束优先

限制比赋能更重要

权限检查、隔离

能清楚回答智能体能做什么

可验证性

每步都可审计

日志、追踪、重放

能重现任何操作的细节

渐进信任

信任逐步建立

权限评估、升降级

有明确的升级标准

故障假设

故障总会发生

重试、降级、隔离

单个故障不会导致系统崩溃

下一章将深入运行时引擎的实现,这些设计原则将在实践中得到充分体现。

最后更新于