5.3.2 Bucketed Join (分桶表Join优化)


文档摘要

5.3.2 Bucketed Join (分桶表Join优化) Hive 5.3 查询优化:深入 Bucketed Join (分桶表Join优化) 5.3.2 Bucketed Join (分桶表Join优化) 详解 1. 什么是分桶表 (Bucketed Table)? 在深入 Bucketed Join 之前,我们首先需要理解什么是 Hive 中的分桶表。分桶是将表数据按照指定的列的哈希值分散到预先定义的数量的桶 (bucket) 中。与分区表 (Partitioned Table) 按照列值进行目录级别的物理分割不同,分桶是在表内部将数据进一步细分。 创建分桶表的语法示例: 上述语句创建了一个名为 的表,并指定按照 列进行分桶,分成 4 个桶。


发布者: 作者: 转发
评论区 (0)
U