2.3 语言模型 (N-gram, RNNLM) 2.3 语言模型 (N-gram, RNNLM) 在语音识别系统中,语言模型 (Language Model, LM) 是一个至关重要的组成部分,它负责评估一个词序列的语法合理性和出现概率。与声学模型(Acoustic Model, AM)关注语音信号与音素或词的对应关系不同,语言模型则侧重于词与词之间的关联性。在Kaldi工具包中,语言模型的构建和集成是实现高性能语音识别的关键步骤之一。 2.3.1 语言模型概述 定义: 语言模型是一种对词序列(或句子)的概率分布进行建模的工具。给定一个词序列 $W = w1, w2, ..., wn$,语言模型的目标是计算该序列出现的概率 $P(W) = P(w1, w2, ..., wn)$。