verl 中的 Wandb Weave 功能 在 Agentic RL 中,为了帮助我们更好的分析 trajectory 中的的多轮对话和工具调用对优化训练过程,verl 提供了 Trace 功能,可记录指定函数的输入、输出及时间戳,并支持在可视化界面中查看,目前支持 。我们在这篇文档中解析如何使用 weave。 感谢 chengxi li @CMU 和 Chenyang Zhao @Amazon 的贡献。