6.1.1 RoPE (Rotary Positional Embeddings) 缩放与线性插值 6.1.1 RoPE (Rotary Positional Embeddings) 缩放与线性插值:从原理到工程落地的深度解析 在大语言模型(LLM)的演进历程中,上下文长度的扩展始终是核心竞技场之一。当我们谈论让模型“读万卷书”时,实际上是在挑战模型对位置信息的感知边界。RoPE(Rotary Positional Embeddings)凭借其优秀的相对位置编码能力和随距离衰减的注意力特性,成为了当前主流模型架构的首选。然而,模型预训练时的上下文长度往往受限于算力成本,难以直接满足超长文本推理的需求。