14.3 开放问题

即使有了成熟的框架、完善的评估、严格的安全防护,智能体系统仍面临深层的、可能需要多年研究才能解决的问题。

本节讨论四大开放问题:可靠性的理论上限、长期记忆与目标保持、多智能体系统的涌现行为控制、以及成本效率与性能的帕累托权衡。

14.3.1 可靠性的理论上限

可靠性问题陈述

给定一个LLM(能力有限),通过工具扩展能力。 最终的系统可靠性有上限吗?

可靠性 = P(正确完成任务)
        = P(LLM正确推理) × P(工具正确执行) × P(系统无故障)
        ≤ min(P(LLM推理), P(工具执行), P(系统稳定))

当前现状(截至 2024 年底的 GAIA 排行榜数据):

  • Claude Sonnet 在 GAIA Level 1 成功率约 82%

  • 在 Level 3 约 65%

  • 随着推理步骤增加,成功率显著衰减

理论问题

  • 是否存在一个k,使得k步推理后成功率→0?

  • 如何从根本上提升长链推理的可靠性?

  • 或者,Agent应该避免长链推理,转为交互式设计?

研究方向

可靠性研究框架的参考实现:

14.3.2 长期记忆与目标保持

长期记忆问题陈述

现有Agent使用的上下文窗口虽已扩展至 200K-1M tokens(如 Claude Sonnet 4.6 支持 100 万 tokens),但仍然是有限的短期窗口。 如何让智能体维持长期记忆并在多天/月的时间尺度上保持目标?

当前方案的局限

当前短期内存实现的局限性示例:

理想的长期记忆系统

代码示例如下:

技术挑战

  1. 存储成本:长期记忆的向量化和检索成本

  2. 一致性:多智能体系统中的记忆一致性

  3. 遗忘:何时有意遗忘,以防止记忆过载

  4. 隐私:长期存储敏感信息的风险

14.3.3 涌现行为与控制

涌现行为问题陈述

当多个智能体交互时, 整个系统可能出现非预期的涌现行为 (Emergent Behavior)。

案例:多智能体竞争

示例如下:

解决方向

方案如下:

14.3.4 智能体安全的攻防升级

安全攻防问题陈述

随着智能体能力提升, 安全防护需要持续进化。攻击者可能:

  1. 发现新的Harness漏洞

    • 当前的路径校验可能被新编码方式绕过

    • 新的危险命令组合出现

  2. 提示注入进化

  3. 工具链攻击

防守策略的展望

框架示例如下:

14.3.5 成本效率的帕累托前沿

成本效率问题陈述

成功率、响应时间、成本之间无法同时优化,存在帕累托权衡。

权衡问题

示例代码如下:


本节总结:这些开放问题代表了Agent工程的科学边界。解决它们需要跨越工程、数学、经济学的多学科合作,可能需要十年或更长时间。但正是这些挑战驱动了该领域的创新和进步。

最后更新于