2.2 语音信号处理与特征提取

文档摘要

2.2 语音信号处理与特征提取 2.2 语音信号处理与特征提取在语音识别系统中，声学模型 (Acoustic Model, AM) 的首要任务是将输入的语音信号片段映射到声学单元（如音素、上下文相关的音素或更细粒度的状态）。然而，原始的语音波形是高维、冗余且对噪声、说话人差异等非常敏感的。因此，在将语音信号送入声学模型之前，必须进行一系列的预处理和特征提取步骤。本章将详细介绍这些关键技术，其目标是将原始语音波形转换为一系列紧凑、鲁棒且信息丰富的特征向量序列。整个过程可以概括为：原始语音信号 -> 预处理 -> 分帧加窗 -> 频域分析 -> 特征提取 -> 形成特征向量序列。 2.2.1 语音信号的数字化与预加重尽管现代语音识别系统处理的是数字语音，但理解其来源是必要的。