第十一章 Agentic-RL


文档摘要

第十一章 Agentic-RL 11.1 从 LLM 训练到 Agentic RL 在前面的章节中,我们实现了多种智能体范式和通信协议。不过智能体处理更复杂的任务时表现不佳,自然会有疑问: 如何让智能体具备更强的推理能力?如何让智能体学会更好地使用工具?如何让智能体能够自我改进? 这正是 Agentic RL(基于强化学习的智能体训练)要解决的核心问题。本章将为 HelloAgents 框架引入强化学习训练能力,让你能够训练出具备推理、工具使用等高级能力的智能体。


发布者: 作者: 转发
评论区 (0)
U