4.1 模型输入与输出处理(Embedding层) 4.1 模型输入与输出处理(Embedding层) 在自然语言处理(NLP)领域,Transformer模型作为一场革新,其成功的基础之一在于它能够有效地处理离散的文本数据。然而,神经网络模型本质上是处理连续的数值数据的。因此,将原始的文本序列(一系列离散的词或子词单元)转换为模型可以理解和处理的连续向量表示,是构建任何基于神经网络的NLP模型的首要步骤。在Transformer模型中,这一关键的转换由Embedding层(词嵌入层)及其相关的输出处理机制完成。