1.2.1 统计冗余:熵编码原理 你有没有遇到过这样的场景? 凌晨两点,线上服务告警:视频转码集群 CPU 持续 98%,队列积压超 12 万帧,下游播放器开始批量报 ——不是文件丢了,是编码器根本没来得及写完就崩溃了。运维甩来一张火焰图: 占比 63.7%,底下堆栈深达 47 层,全是 和 的幽灵调用。 你打开代码,看到这样一段“教科书式”的 Huffman 编码实现: 它能跑通测试用例,能压缩出正确比特流,甚至在 1MB 小文件上比 zlib 快 12%——可一旦喂给 4K HDR 视频帧(单帧原始数据 37MB),它就成了系统级定时炸弹。 这不是算法错了。Huffman 编码本身无懈可击。错的是我们把熵编码当成了数学题,却忘了它首先是工程问题。