2.4 反思与自我修正
2.4.1 什么是反思
尝试 → 失败 → 反思(为什么失败?)→ 总结(学到了什么?)→ 再次尝试2.4.2 与人类学习的类比
阶段
人类学习
反思智能体
2.4.3 反思的三要素
执行者
class Actor:
def act(self, task: str, memory: List[str]) -> Trajectory:
"""
执行任务,返回执行轨迹
memory: 之前反思得到的经验
"""
prompt = f"""
任务:{task}
之前的经验教训:
{format_memories(memory)}
请执行任务...
"""
return execute_with_react(prompt)评估者
反思者
2.4.4 完整的 Reflexion 循环
实际应用示例
示例:代码编写任务
2.4.5 记忆管理策略
短期记忆(滑动窗口)
长期记忆(持久化存储)
经验泛化
2.4.6 与其他技术的结合
Reflexion + ReAct
Reflexion + Tool Learning
2.4.7 评估 Reflexion 的效果
关键指标
指标
说明
实验结果(参考论文)
2.4.8 局限性与注意事项
Last updated
