> For the complete documentation index, see [llms.txt](https://yeasy.gitbook.io/harness_engineering_guide/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://yeasy.gitbook.io/harness_engineering_guide/fu-lu/appendix/glossary.md).

# 附录 A：术语表

本术语表收录全书涉及的技术术语，按字母排序。中文术语标注中英对照。

## A

**Agent** （智能体）：能够感知环境、自主决策和执行行动的自治系统。本书特指基于LLM的工具调用Agent。

**AgentBench**：Tsinghua University 等机构开发的多领域 Agent 基准测试，覆盖 8 个领域。

**Always-On Assistant** （持久化助手）：长期在线的Agent，能跨会话维持状态和目标。OpenClaw的Heartbeat模式是其实现。

**Auto Mode Classifier**：Claude Code Auto Mode 使用的权限分类器，用于在无提示运行时评估工具调用风险，并阻止不可逆、破坏性或超出环境边界的操作。

## B

**Backpressure** （背压）：当下游处理速度跟不上上游生产速度时，系统通过队列限流或暂停接收来保护自身的机制。Harness 中常见于工具调用并发控制。

**Budget** （预算）：参见 Token Budget。

## C

**Capability** （能力/功能）：智能体对外暴露的高层能力或权限面，通常由一个或多个工具、技能或服务支撑。它描述“系统能做什么”，不等同于单个可执行调用。

**Checkpoint** （检查点）：智能体推理过程的保存点，用于恢复和持久化。

**Circuit Breaker** （熔断器，又译断路器）：借鉴电路保护的容错模式——当连续失败次数达到阈值时自动切断调用，避免雪崩。MiniHarness 的 `ModelSelectionEngine` 中有实现。

**Claude Code**：Anthropic 官方提供的智能体编码工具(Agentic Coding Tool)，内置权限管理、路径校验、危险命令检测。

**Composed Tool** （复合工具）：由多个基础工具组合而成的高层工具。

## D

**Dangerous Patterns**：Claude Code 中的危险命令检测模块，包含多个禁止命令的黑名单。

**Defense in Depth** （纵深防护）：多层安全防护设计，单层失效不导致整体失败。

**Drift Detection** （漂移检测）：在长时任务中监测智能体行为是否偏离预期目标，并在必要时进行纠正。参见第 4.5 节。

**Dynamic Tool Discovery** （动态工具发现）：运行时查询和发现可用工具，而非启动时静态加载。MCP 支持 `tools/list` 查询，并可通过 `notifications/tools/list_changed` 通知工具列表变化。

## E

**E2E Testing** （端到端测试）：测试完整工作流，从用户输入到最终输出。

**Emergent Behavior** （涌现行为）：多智能体系统中出现的非预期、无法从单个Agent推断的系统级行为。

**Execution Harness** （执行驾驭层）：Harness 的别名或强调执行面的说法，指 LLM 之外的运行时支撑系统，包含工具定义、运行时引擎、安全防护、评估系统等，本身不含 LLM。参见 Harness。

## F

**Fallback** （降级/回退）：主路径失败时切换到备用路径的策略。常见于模型选择（主模型不可用时自动切换到备用模型）和工具调用。

**Feature Gate** （特性门控）：通过配置开关控制功能的启用/禁用，无需重新部署。参见第 10.4 节。

## G

**GAIA**：由 Meta、Hugging Face 等机构研究者开发的通用 AI 助手基准，三个难度等级，约 466 个任务。

**Guardrail** （护栏）：执行前对工具调用的检查机制，防止危险操作。包括危险命令检测、约束检查、超时强制。

## H

**Harness** （驾驭）：本书的核心概念。Harness 一词意为“驾驭”，原指骑手用以驾驭烈马的缰绳和鞍具系统。在本书中，指包裹在大模型外围、将其推理能力转化为可靠可控生产级系统的完整工程基础设施。

**Heartbeat** （心跳）：OpenClaw的自驱模式，定期检查待办事项并执行。

## I

**Injection Attack** （注入攻击）：通过恶意输入改变系统行为的攻击。包括提示注入、路径穿越等。

**Interoperability** （互操作性）：不同框架和系统之间的兼容性和协作能力。

## J

**JSON Schema**：用于描述 JSON 数据结构的规范。MCP 协议和工具定义中广泛使用，用于声明工具参数的类型和约束。

## K

**Key Rotation** （密钥轮换）：定期更换 API 密钥或加密密钥的安全实践，降低密钥泄露后的影响范围。

## L

**LangChain**：开源智能体框架，提供工具调用、记忆管理、链式推理等功能。

**Langfuse**：开源可观测性工具，用于监控智能体执行和收集指标。

**LLM** （大语言模型）：基础模型，如Claude、GPT、Llama。

**Long-term Memory** （长期记忆）：跨会话的持久化记忆，与短期上下文对比。

## M

**MCP** (Model Context Protocol)：Anthropic 发起的开放协议，用于让 LLM 应用与外部工具、资源和提示词集成。当前规范支持 JSON-RPC 2.0 消息、stdio 与 Streamable HTTP 等机制。

**Mock Testing** （模拟测试）：用模拟对象代替真实依赖的测试方式，快速但可能不够真实。

**Multi-Agent System** （多智能体系统）：多个智能体协作完成任务的系统。

## N

**NIST**：美国国家标准技术研究院，2026年发起AI Agent标准化倡议。

**Null Hypothesis** （零假设）：统计测试中的默认假设，用于验证改进是否显著。

## O

**OpenClaw**：开源自驱型智能体框架（前身为 Clawdbot），特色是 Heartbeat 模式和 SOUL.md 行为约束。由 Peter Steinberger 创建，非 Anthropic 内部项目。

**Orchestration** （编排）：多工具或多智能体的协调和控制。

## P

**Pareto Frontier** （帕累托前沿）：多目标优化中，无法同时改进所有目标的最优解集合。

**Path Validation** （路径校验）：防止路径穿越攻击的5层防护机制（长度、解码、Unicode、平台、realpath）。

**PermissionMode**：Claude Code 的权限管理模式，主要包括 default（按需询问）、acceptEdits（自动接受编辑）、plan（只读计划）、auto、dontAsk 和 bypassPermissions（跳过权限检查，仅限隔离环境）等。

**Prompt Injection** （提示注入）：通过恶意输入改变LLM的行为，使其执行非预期操作。

## Q

**Quality Gate** （质量门控）：对模型输出进行自动化检查的机制，不满足质量标准的输出会被拦截或重试。参见第 7.3 节。

## R

**Regression Test** （回归测试）：确保新改动不会导致已有功能性能下降的测试。

**Reliability** （可靠性）：系统正确完成任务的概率。

**Retrieval-Augmented Generation** （检索增强生成）：结合信息检索和文本生成的方法。

## S

**Sandbox** （沙箱）：隔离执行环境，限制工具调用的破坏范围。分为进程级、容器级、VM级。

**Schema Validation** （Schema校验）：验证工具参数是否符合定义的Schema。

**SOUL.md**：OpenClaw中的智能体行为约束文档，定义智能体的工作原则和限制。

**Streaming** （流式处理）：将模型输出按 token 或事件逐步返回给客户端的方式，降低首字延迟并支持实时反馈。参见第 4.3 节。

**Sub-Agent** （子智能体）：由父 Agent 创建的 Agent，权限边界通常由父 Agent 或宿主应用的策略控制。MCP 的 HTTP 授权规范提供 OAuth 2.1、scope、resource 绑定和 step-up auth 等机制，但不是通用的子智能体权限委托层。

**SWE-Bench**：软件工程基准，包含2294个真实GitHub问题，用于评估代码修改能力。

## T

**Token Budget** （Token 预算）：为单次任务或单轮对话设定的 token 消耗上限，用于控制成本和防止上下文溢出。参见第 4.6 节。

**Token Efficiency** （Token效率）：完成任务所消耗的Token数，越少越高效。

**Tool** （工具）：运行时可调度的可执行调用单元，包括API调用、文件操作、代码执行等。一个 Capability 可以由一个或多个 Tool 支撑。

**Tool Calling** （工具调用）：LLM根据推理结果调用工具的过程。

**Trajectory** （轨迹）：智能体执行过程中的工具调用序列。

**Trajectory-level Evaluation** （轨迹级评估）：评估工具调用序列的效率（最优性比、错误恢复率等）。

## U

**Unicode Normalization** （Unicode规范化）：统一Unicode字符的多种表示形式，防止基于Unicode的路径穿越。

**URL Encoding** （URL编码）：将特殊字符编码为%xx形式，可能被利用进行路径穿越。

## V

**Vector Store** （向量存储）：存储文本嵌入向量的数据库，支持语义相似度检索。智能体的长期记忆和 RAG 系统的核心组件。

## W

**WebArena**：CMU 研究者开发的网页自动化基准，包含 812 个现实网站任务。

**Whitelist** （白名单）：允许的操作或资源列表。相比黑名单更安全。

## X

**XSS** (Cross-Site Scripting)：跨站脚本攻击。在 Harness 中，当智能体生成 HTML 内容或操作 Web 页面时需要防范。

## Y

**YOLO Mode**：Claude Code 中的非正式称呼，指使用 `--dangerously-skip-permissions` 标志跳过所有权限检查的模式。注意与 Auto Mode（使用 ML 分类器自动决策）不同。

## Z

**Zero-Knowledge Proof** （零知识证明）：证明某个陈述真实，而无需披露具体信息。在Agent安全中用于验证工具输出。

***

**说明**：本术语表定期更新，反映该领域的最新发展。有遗漏或错误，欢迎反馈。