1.2 语音识别系统基本架构 1.2 语音识别系统基本架构 自动语音识别(Automatic Speech Recognition, ASR)系统的核心任务是将人类的语音信号转换为对应的文本序列。理解其基本架构是深入学习语音识别技术的基石。一个典型的现代ASR系统并非一个单一的黑箱,而是由多个协同工作的模块组成。这些模块各司其职,共同完成从模拟或数字语音信号到离散文本的转换过程。 ASR系统的基本架构通常可以概括为以下几个主要组成部分: 语音输入 (Speech Input) 特征提取 (Feature Extraction) / 前端处理 (Front-end Processing) 声学模型 (Acoustic Model, AM) 发音词典 (Lexicon /