4.1.4 物理算子选择 (Join Algorithms, Aggregation) 在数据库系统的心脏深处,查询编译与优化不是一场优雅的数学推演,而是一场在毫秒级时间窗口内完成的精密战术决策——它必须同时权衡数据分布、内存带宽、CPU缓存行对齐、磁盘I/O模式、并发竞争、甚至NUMA节点拓扑。而物理算子选择,正是这场决策中最具实操张力的一环:当逻辑计划已定, 不再是一个抽象的笛卡尔积+谓词过滤,而是要决定——此刻,该让哪一段代码真正跑起来? 我们不谈“Nested Loop Join很慢”这种教科书式断言;我们要问:当左表12万行、右表8300万行、连接键是 、且右表在SSD上以Parquet列存格式按 全局排序存储时,Nested Loop Join真的慢吗?