第十一章 Agentic-RL

文档摘要

第十一章 Agentic-RL 11.1 从 LLM 训练到 Agentic RL 在前面的章节中，我们实现了多种智能体范式和通信协议。不过智能体处理更复杂的任务时表现不佳，自然会有疑问: 如何让智能体具备更强的推理能力?如何让智能体学会更好地使用工具?如何让智能体能够自我改进? 这正是 Agentic RL(基于强化学习的智能体训练)要解决的核心问题。本章将为 HelloAgents 框架引入强化学习训练能力，让你能够训练出具备推理、工具使用等高级能力的智能体。