4.1 GMM-HMM 训练流程 (单音素、三音素、LDA+MLLT+SAT) 4.1 GMM-HMM 训练流程 (单音素、三音素、LDA+MLLT+SAT) 在语音识别领域,高斯混合模型-隐马尔可夫模型 GMM-HMM 是一个经典且基础的声学模型框架。Kaldi 工具包的核心训练流程,尤其是早期版本和许多入门示例中,都围绕着 GMM-HMM 的迭代优化展开。本章将深入解析 Kaldi 中 GMM-HMM 训练的各个阶段,从最简单的单音素模型逐步过渡到更复杂、更鲁棒的三音素模型,并引入特征变换(如 LDA、MLLT)和说话人自适应技术(如 SAT),以提升模型性能。