2.2.3 预测技术:帧间预测与后向预测 预测不是猜,是时间维度上的“借力打力”:后向预测在AAC低延迟编码中的致命陷阱与精准修复 你有没有遇到过这样的场景? 在车载语音通话系统中,端到端延迟被硬性限定在120ms以内;音频编码器选用AAC-LC,采样率48kHz,帧长1024点,每帧21.33ms;但无论怎么调高码率、关闭TNS、禁用PNS,主观听感里总有一丝挥之不去的“拖尾感”——像隔着一层毛玻璃说话,清晰却发闷,尤其在“p”、“t”、“k”这类爆发音之后,紧随其后的元音仿佛被轻轻拽住了一毫秒。频谱上看,2–4kHz能量衰减异常缓慢;客观指标上,PESQ得分卡在3.2,离目标3.8差得不多,却死活上不去。 团队排查了整整三天:网络抖动?RTT稳定在18ms;解码器缓冲?已设为最小;