2.3 语音建模单元 2.3 语音建模单元 (Speech Modeling Units) 在语音识别系统中,声学模型 (Acoustic Model, AM) 的核心任务是将输入的声学特征序列映射到一系列能够代表语音内容的离散单元上。这些离散单元就是语音建模单元。它们是连接连续的声学信号与离散的语言学或次语言学概念之间的桥梁。本章将深入探讨语音建模单元的定义、作用以及常见的类型。 2.3.1 定义与作用 (Definition and Role) 语音建模单元是声学模型在训练和识别过程中所基于的基本语音单位。声学模型不会直接尝试识别完整的词语或句子,因为它们的数量过于庞大且变异性极高。相反,声学模型会预测更小、更易于建模的语音单元出现的概率。这些单元可以是音素、音素的变体、音素的部分等等。