5.4.4 并行度参数调优 Hive 并行度参数调优详解与实践 (基于 5.4.4 并行度参数调优领域) 1. 理解 Hive 并行度 Hive 的并行度主要体现在两个层面:Map 阶段的并行度 和 Reduce 阶段的并行度。 Map 阶段并行度: 指的是在 Map 阶段同时运行的 Map Task 的数量。Map Task 负责读取和处理输入数据,并将结果输出到中间结果。Map 阶段的并行度受输入数据分片(Input Split)的数量和集群资源限制。 Reduce 阶段并行度: 指的是在 Reduce 阶段同时运行的 Reduce Task 的数量。Reduce Task 负责接收 Map 阶段的中间结果,并进行聚合、排序等操作,最终输出最终结果。