5.4.1 标量压缩(Zstd、Snappy) 标量压缩,是数据工程中那把最锋利的“手术刀”——它不碰结构、不改语义、不触 schema,只对一维字节流做精准减脂。当我们在 Kafka 消息体里塞进一个 1.2MB 的 JSON 日志,在 Parquet 文件中写入十亿行浮点特征,在 Prometheus 远程写入接口上传连续采样的指标序列时,真正决定吞吐与延迟上限的,往往不是网络带宽,也不是磁盘 IOPS,而是 CPU 在 和 之间那毫秒级的权衡。Zstd 与 Snappy,并非教科书里并列的两个算法名词;它们是两种截然不同的工程哲学在压缩领域的具象化:一个追求可调精度下的帕累托最优,另一个信奉确定性低延迟即正义。今天,我们就剥开它们的源码肌理,亲手拧紧每一个影响性能的螺丝钉。