11.2 安全使用指南
11.2.1 输入护栏 (Input Guardrails)
提示词注入 (Prompt Injection)
<user_input>{input}</user_input>
PII 过滤
11.2.2 输出护栏 (Output Guardrails)
话题阻断
格式校验
11.2.3 行为护栏 (Action Guardrails)
权限控制 (The Principle of Least Privilege)
确认模式 (Confirmation Mode)
11.2.4 架构设计模式:Guardrail API
最后更新于
