2.2 声学模型 (HMM, GMM, DNN, TDNN) 2.2 声学模型 (HMM, GMM, DNN, TDNN) 在语音识别系统中,声学模型是核心组件之一,其主要任务是建立声学特征与语音单位(通常是音素或上下文相关的音素,如三音素)之间的概率关系。它回答了这样一个问题:“给定一段声学特征序列,它是哪个语音单位发出的概率最大?”本章将深入探讨语音识别中几种关键的声学模型,包括隐马尔可夫模型(HMM)、高斯混合模型(GMM)、深度神经网络(DNN)以及时延神经网络(TDNN),并阐述它们之间的演进关系。 2.2.1 隐马尔可夫模型 (Hidden Markov Model, HMM) 隐马尔可夫模型(HMM)是一种统计模型,它描述了一个含有隐藏的马尔可夫过程的系统。