POLARIS:用LLM评判与锚定参考提升小模型长故事生成质量


文档摘要

POLARIS深度解读:面向长篇创意写作的轻量级模型强化学习新范式 ——一种以人类参考为锚点、以结构化判据为奖赏的可控生成策略 📋 论文基本信息 标题:POLARIS: Guiding Small Models to Write Long Stories 作者:Rishanth Rajendhran, Jenna Russell, Mohit Iyyer, John Frederick Wieting ArXiv ID:arXiv:2606.04095v1(注:该ID为模拟编号,实际发布日期为2026年6月4日;按arXiv惯例,ID中“2606”对应2026年6月) 领域分类:cs.CL(Computation and Language)、cs.


发布者: 作者: 转发
评论区 (0)
U