1.2.1 列式存储架构 列式存储不是一种“更省空间”的权宜之计,也不是数据库厂商在宣传册上轻描淡写的性能优化“附加项”。它是现代分析型系统在数据洪流中锚定确定性的底层罗盘——当行存还在逐行解包、反复跳转、为每一笔交易加载整条记录时,列式存储早已将“销售额”这一列从百万行中精准剥离,在连续内存页上完成向量化聚合;当CPU缓存因随机访问而频繁失效时,它正以SIMD指令批量处理数千个 的布尔判断;当压缩算法面对杂乱无章的混合类型束手无策时,它却让同一列中重复出现的 字符串坍缩为一个字典索引与一组游程编码(RLE)计数。 这不是魔法。这是可推演、可调试、可调优、可重实现的工程事实。 我们今天要拆开的,正是这台精密机器的核心齿轮:列式存储架构的落地实现。