8.1.2 混合解码方案(CPU+GPU/DSP) 在视频处理的工业现场,我们常被一个问题反复叩问:当4K@60fps的H.265码流如潮水般涌向嵌入式播放终端,CPU尚在逐帧解码中喘息,GPU却空转着纹理单元等待像素;而当低功耗IoT设备试图解析一段8-bit AV1码流,DSP的VLIW流水线已就绪,CPU却因频繁中断陷入调度泥潭——解码不是单点突破的竞赛,而是多核协同的交响。混合解码(Hybrid Decoding)绝非“CPU干一点、GPU干一点”的粗放拼凑,它是对计算资源拓扑、数据访存瓶颈、指令级并行特性与编解码算法内在可分性的深度耦合。本节不谈概念,不列综述,只讲如何在真实芯片上跑通一条从NALU输入到YUV帧输出的混合解码流水线——以H.