3.1.2.2 算术编码与范围编码


文档摘要

3.1.2.2 算术编码与范围编码 3.1.2.2 算术编码与范围编码:突破概率边界的精度艺术 在数据压缩的漫长征途中,哈夫曼编码(Huffman Coding)曾长期统治着熵编码的领地。然而,随着信息论研究的深入和对压缩比近乎偏执的追求,开发者们逐渐触碰到了哈夫曼编码的物理天花板:它强制要求每个符号至少占据一个比特。在处理概率极高(例如 $P > 0.5$)的符号时,这种“整数比特”的限制会导致巨大的冗余。 算术编码(Arithmetic Coding, AC)与它的孪生兄弟范围编码(Range Coding, RC)的出现,彻底打破了这一桎梏。它们不再为单个符号分配码字,而是将整个消息映射为 $[0, 1)$ 区间内的一个实数。这种“非整数位”的特性,使得压缩效率能够无限逼近香农熵。


发布者: 作者: 转发
评论区 (0)
U