3.1.1 数据块组织 在列式存储的世界里,数据块(Data Block)从来不是一块被随意堆砌的砖石;它是一台精密钟表里的游丝——纤细、坚韧、微小到肉眼难辨,却直接决定整套系统走时的精度与寿命。当我们谈论“3.1.1 数据块组织”时,我们并非在讨论某种抽象的数据容器命名规范,而是在拆解一个现代分析型数据库最底层的物理契约:数据如何被切分、对齐、压缩、索引、缓存,并最终以毫秒级延迟响应千万行扫描请求。这不是教科书式的概念复述,而是工程师凌晨三点盯着 perf 火焰图调试 cache miss 时,真正需要叩问的六个问题: ——为什么 Parquet 的 默认大小是 1MB,而不是 512KB 或 4MB? ——当 中某列的 null 比例达到 92.