第七章:学习、评估与进化

如果智能体每天犯同样的错误,那它就算不上真正的智能。本章探讨智能体的动态进化能力。不同于 LLM 的预训练(Pre-training)是一次性的,智能体的学习(Learning)应该是终身的、持续的。

本章重点关注强化学习在智能体中的应用,如何建立科学的评估体系来度量智能体的能力,以及如何实现持续的自我进化。

章节导读

核心概念预览

具体示例如下:

spinner

图 7-0:智能体进化循环

下一章将进入实战环节,了解当前主流的智能体开发框架。


下一节: 7.1 从反馈中学习:RLHF 与 RLAIF

Last updated