3.3 传统语言模型 (N-gram) 3.3 传统语言模型 (N-gram) 在语音识别系统中,语言模型 (Language Model, LM) 的核心作用是评估一个词序列出现的概率,或者在给定前文的情况下预测下一个词出现的概率。它为声学模型输出的可能的词序列提供语言学上的约束和偏好,帮助系统选择最符合语言习惯的结果。在深度学习兴起之前,传统语言模型的主流方法便是基于 N-gram 的模型。 3.3.1 N-gram 模型的基本概念 N-gram 模型是一种基于统计的语言模型。其核心思想是利用马尔可夫假设 (Markov Assumption) 来简化词序列概率的计算。