POLARIS：用LLM评判与锚定参考提升小模型长故事生成质量

文档摘要

POLARIS深度解读：面向长篇创意写作的轻量级模型强化学习新范式 ——一种以人类参考为锚点、以结构化判据为奖赏的可控生成策略 📋 论文基本信息标题：POLARIS: Guiding Small Models to Write Long Stories 作者：Rishanth Rajendhran, Jenna Russell, Mohit Iyyer, John Frederick Wieting ArXiv ID：arXiv:2606.04095v1（注：该ID为模拟编号，实际发布日期为2026年6月4日；按arXiv惯例，ID中“2606”对应2026年6月）领域分类：cs.CL（Computation and Language）、cs.