# 12.1 术语表

本书中出现的关键术语及其解释。

## 12.1.1 术语翻译约定

| 英文术语                 | 中文翻译    | 本书写法                   | 首次出现   |
| -------------------- | ------- | ---------------------- | ------ |
| Agent                | 智能体     | 智能体 (Agent)            | 1.1 节  |
| Token                | 词元      | Token（代码/技术讨论中保留英文）    | 1.1 节  |
| Prompt               | 提示词     | 提示词 或 提示词 (Prompt)     | 2.5 节  |
| Context              | 上下文     | 上下文                    | 1.1 节  |
| Context Engineering  | 上下文工程   | 上下文工程                  | 3.6 节  |
| Embedding            | 嵌入向量    | 嵌入 或 嵌入向量              | 3.3 节  |
| Hallucination        | 幻觉      | 幻觉                     | 1.1 节  |
| Fine-tuning          | 微调      | 微调                     | 9.3 节  |
| RAG                  | 检索增强生成  | RAG                    | 3.4 节  |
| Guardrails           | 护栏      | 护栏                     | 2.3 节  |
| Sandbox              | 沙箱      | 沙箱                     | 4.3 节  |
| Orchestrator         | 编排器     | 编排器                    | 5.x 节  |
| Trace / Tracing      | 追踪      | Trace 或追踪              | 9.2 节  |
| Trajectory           | 轨迹      | 轨迹                     | 9.2 节  |
| Human-in-the-Loop    | 人在回路    | HITL 或人在回路             | 6.x 节  |
| Agentic Coding       | 智能体编程   | 智能体编程 (Agentic Coding) | 10.1 节 |
| Vibe Coding          | 氛围编程    | Vibe Coding            | 10.1 节 |
| Model Distillation   | 模型蒸馏    | 蒸馏                     | 9.3 节  |
| Speculative Decoding | 投机解码    | 投机解码                   | 9.3 节  |
| MCP                  | 模型上下文协议 | MCP                    | 4.3 节  |
| Function Calling     | 函数调用    | 函数调用 或 工具调用            | 1.1 节  |

***

## 12.1.2 A

**Agent (智能体)**: 具有自主决策能力的 AI 系统，能够感知环境、制定计划并执行行动以达成目标。

**Agent-to-Agent Protocol (A2A, 智能体对智能体协议)**: 一类用于智能体间通信和协作的协议标准。

**Agent Card (智能体名片)**: A2A 协议中智能体发布的自我描述文档，包含身份和能力信息。

**Artificial General Intelligence (AGI, 通用人工智能)**: 具有人类水平通用智能的 AI 系统。

**Alignment (对齐)**: 确保 AI 系统的行为与人类意图和价值观一致的过程。

**Agentic Coding (智能体编程)**: AI 作为自主开发伙伴参与软件开发的新范式。

**Agent Harness (智能体运行壳)**: 包裹在 AI 模型外围的操作系统级基础设施，通过预设系统指令、工具调用管理、生命周期钩子等机制，专门管理长周期任务，解决模型在复杂任务中易跑偏、忘规则等问题。

**Agentic Workflow (智能体工作流)**: AI 以迭代、自主方式完成复杂任务的工作模式。

**Agentic Development Maturity Model (智能体研发成熟度模型)**: 一种用于描述研发模式演进的分级框架：L1 辅助、L2 协同、L3 自主。

## 12.1.3 B

**Budget Circuit Breaker (预算熔断)**: 基于 Token 累积消耗或执行时间设置的硬阈值机制，超额时立即阻断智能体执行，防止失控的循环消耗大量资源。

## 12.1.4 C

**Chain-of-Thought (CoT, 思维链)**: 让模型在给出答案前展示推理步骤的技术。

**Computer Use (计算机使用)**: AI 直接控制鼠标、键盘操作桌面环境的能力。

**Context Engineering (上下文工程)**: 管理大语言模型有限“注意力预算”的学科，比提示词工程更广泛。

**Context Window (上下文窗口)**: 模型一次能处理的最大词元 (Token) 数量。

**Compounding Engineering (复利工程)**: 通过知识沉淀使智能体系统持续进化的工程方法。

## 12.1.5 D

**Deliberative Alignment (审慎对齐)**: 推理模型在思维链中显式调用安全原则的技术。

**Disaggregated Serving (分离式推理架构)**: 将模型推理的预填充（Prefill）和解码（Decode）阶段部署到不同集群的架构模式，解决高并发场景下的计算/访存资源竞争问题。

**Domain Randomization (域随机化)**: 在仿真训练中对材质、光照、摩擦系数等环境参数进行随机变化，以训练模型学到更鲁棒特征，从而改善仿真到现实（Sim-to-Real）的策略迁移效果。是具身智能中的关键技术。

## 12.1.6 E

**Embedding (嵌入向量)**: 将文本转换为高维向量表示，用于语义相似度计算。

## 12.1.7 F

**Function Calling (函数调用)**: 模型生成结构化的函数调用请求，由外部系统执行。

**Few-Shot Learning (少样本学习)**: 通过少量示例让模型学会新任务的技术。

**FinOps (云财务运营)**: 将财务问责制引入云和 AI 支出的文化与实践。在智能体体系中意味着工程团队需对每一次 Token 消耗的投资回报率（ROI）负责。

## 12.1.8 G

**Graph of Thoughts (GoT, 思维图)**: 将推理过程组织为图结构的高级推理技术。

**Guardrails (护栏)**: 对智能体输入输出施加约束的安全机制，用于防止有害内容生成、越权操作等风险。

**Grounding (事实锚定)**: 通过检索增强生成（RAG）等技术将智能体输出锚定到可验证的外部证据或环境状态，减少幻觉。可选地附带引用/证据链接，从而提高事实准确性。

## 12.1.9 H

**Hallucination (幻觉)**: 模型生成看似合理但实际错误的信息。

**Human-in-the-Loop (HITL, 人在回路)**: 在 AI 决策过程中保留人类参与和审批的设计模式。

**Hooks (钩子)**: 在工具或框架的生命周期事件中注入自定义逻辑的机制。

**HTN (Hierarchical Task Network, 分层任务网络)**: 一种任务规划技术，通过递归地将高层目标分解为更小的子任务，形成层级结构的任务网络。在智能体系统中用于复杂任务的分解与编排。

**Instruction Hierarchy (指令层级)**: 定义智能体如何在冲突指令间进行优先级选择的机制，通常遵循 `system ≻ developer ≻ user ≻ tool` 的信任顺序。通过对抗训练（如 IH-Challenge）可增强模型在此层级下的鲁棒性。

## 12.1.10 K

**Knuth, Donald (高德纳)**: 图灵奖得主，1984 年提出“文学编程”（Literate Programming）概念，被视为 Agentic Coding “自然语言优先”理念的思想先驱。

**KV Cache (键值缓存)**: Transformer 模型推理时缓存已计算的 Key-Value 对，避免重复计算前缀 Token。是提示词缓存（Prompt Caching）的底层机制。

## 12.1.11 L

**Large Language Model (LLM, 大语言模型)**: 基于 Transformer 架构、在大规模文本数据上训练的深度学习模型，是智能体系统的核心“大脑”。

**Large Multimodal Model (LMM, 大型多模态模型)**: 能处理文本、图像、音频等多种输入的模型。

**LLM-as-Judge (大模型作为评审)**: 利用大语言模型对其他模型或智能体的输出进行评估、打分或作出合规判断的范式。在红队测试、幻觉检测和质量门禁中广泛应用。

## 12.1.12 M

**Memory Poisoning (记忆投毒)**: 间接提示词注入的一种变种，旨在污染智能体的长期记忆（例如向量检索知识库）。

**Model Context Protocol (MCP, 模型上下文协议)**: 一类用于模型与工具交互的开放协议标准。

**Multi-Agent (多智能体)**: 多个 AI 智能体协作完成任务的系统架构。

**Model Router (模型路由)**: 根据任务复杂度或置信度评估，将请求动态分发到不同规格模型（大模型 vs 小模型）的策略组件，用于优化成本与质量的平衡。

## 12.1.13 O

**Orchestrator (编排器)**: 负责协调多个智能体或工具调用顺序的控制组件。

## 12.1.14 P

**Perceive-Plan-Act Loop (PPA, 感知-规划-行动循环)**: 智能体的基本工作循环。

**Plan Mode (规划模式)**: 智能体先制定计划再执行的工作模式。

**Prompt Engineering (提示词工程)**: 设计有效提示词以引导模型产生期望输出的技术。

## 12.1.15 R

**Retrieval-Augmented Generation (RAG, 检索增强生成)**: 通过检索外部知识增强生成质量。

**ReAct (推理与行动)**: 将推理和行动交织进行的智能体架构模式。

**Reflexion (反思)**: 让智能体从失败中学习并改进的机制。

**Reinforcement Learning from Human Feedback (RLHF, 基于人类反馈的强化学习)**: 使用人类偏好数据优化模型的训练方法。

**Rules (规则)**: 存储在项目规则目录中的项目级行为规范。

**Reasoners (推理模型)**: 在复杂任务上表现更稳定、更擅长多步推理的一类模型，是智能体系统能力提升的重要来源。

## 12.1.16 S

**Sandbox (沙箱)**: 隔离执行环境，防止代码对系统造成危害。

**Skills (技能)**: 封装领域知识的可复用知识包。

**Standard Operating Procedure (SOP, 标准操作流程)**: 预定义的工作流程。

**Stop Sequence (停止序列)**: 控制模型暂停生成、等待工具结果的特殊标记。

**Speculative Decoding (投机解码)**: 用小型“草稿模型”快速预测多个候选 Token，再由大型“目标模型”并行验证的推理加速技术。在不损失生成质量的前提下，可将推理延迟降低数倍。

**Structured Output (结构化输出)**: 让模型按照指定的数据格式（如 JSON Schema）生成内容的技术，提高输出的可解析性。

**Supply Chain Attack (供应链攻击)**: 针对智能体依赖的第三方组件（如 MCP 服务器、插件、工具包）发起的攻击。攻击者通过篡改上游依赖注入恶意代码，影响所有下游智能体系统。

**Sim-to-Real Transfer (仿真到现实迁移)**: 将在虚拟仿真环境中训练的策略（如机器人控制策略）迁移到真实物理环境执行的过程。是具身智能的核心难题，涉及域适应与精确校准。

## 12.1.17 T

**Tool Return Injection (工具返回注入)**: 一种间接提示词注入攻击，攻击者在智能体调用的工具返回结果中隐蔽地嵌入恶意指令，诱导智能体执行非预期操作。属于提示词注入的高级形式，防御需在指令层级训练中加强。

**Token (词元)**: 模型处理的基本文本单位，一个汉字约 1-2 个词元。

**Tool Use (工具使用)**: 智能体调用外部工具扩展能力的能力。

**Tree of Thoughts (ToT, 思维树)**: 将推理过程组织为树结构的推理技术。

**Trajectory (轨迹)**: 智能体完成任务的完整执行路径，包含所有思考和行动。

**Trace / Tracing (追踪)**: 记录智能体从接收任务到产出结果全过程中每个步骤的技术。包括推理轨迹、工具调用、中间状态等，用于调试、优化和审计。

## 12.1.18 V

**Vibe Coding (氛围编程)**: 用自然语言描述需求、由 AI 生成代码的编程风格。

**Vector Database (向量数据库)**: 专门存储和检索向量的数据库系统。

## 12.1.19 Z

**Zero-Shot (零样本)**: 不提供示例，仅通过指令让模型完成任务。

## 12.1.20 复合术语

**Human-in-the-Loop, HITL (人机协作)**: 在智能体工作流的关键决策点引入人类审核与干预的设计模式。用于处理高风险操作、不确定性较高的决策或合规要求。

**Total Cost of Ownership, TCO (总拥有成本)**: 衡量智能体系统全生命周期成本的指标，包括模型推理费用（Token 消耗）、基础设施、开发维护、监控运维和人工干预等各项成本的总和。

***

**下一节**: [推荐论文与阅读清单](/agentic_ai_guide/di-wu-bu-fen-fu-lu/12_appendix/12.2_reading_list.md)


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://yeasy.gitbook.io/agentic_ai_guide/di-wu-bu-fen-fu-lu/12_appendix/12.1_glossary.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.