2.2 语音信号处理与特征提取 2.2 语音信号处理与特征提取 在语音识别系统中,声学模型 (Acoustic Model, AM) 的首要任务是将输入的语音信号片段映射到声学单元(如音素、上下文相关的音素或更细粒度的状态)。然而,原始的语音波形是高维、冗余且对噪声、说话人差异等非常敏感的。因此,在将语音信号送入声学模型之前,必须进行一系列的预处理和特征提取步骤。本章将详细介绍这些关键技术,其目标是将原始语音波形转换为一系列紧凑、鲁棒且信息丰富的特征向量序列。 整个过程可以概括为:原始语音信号 -> 预处理 -> 分帧加窗 -> 频域分析 -> 特征提取 -> 形成特征向量序列。 2.2.1 语音信号的数字化与预加重 尽管现代语音识别系统处理的是数字语音,但理解其来源是必要的。