2.2 声学模型 (HMM, GMM, DNN, TDNN)

文档摘要

2.2 声学模型 (HMM, GMM, DNN, TDNN) 2.2 声学模型 (HMM, GMM, DNN, TDNN) 在语音识别系统中，声学模型是核心组件之一，其主要任务是建立声学特征与语音单位（通常是音素或上下文相关的音素，如三音素）之间的概率关系。它回答了这样一个问题：“给定一段声学特征序列，它是哪个语音单位发出的概率最大？”本章将深入探讨语音识别中几种关键的声学模型，包括隐马尔可夫模型（HMM）、高斯混合模型（GMM）、深度神经网络（DNN）以及时延神经网络（TDNN），并阐述它们之间的演进关系。 2.2.1 隐马尔可夫模型 (Hidden Markov Model, HMM) 隐马尔可夫模型（HMM）是一种统计模型，它描述了一个含有隐藏的马尔可夫过程的系统。