8.3 数据倾斜处理 8.3 数据倾斜处理:在流批一体架构下重构数据分发的公平性契约 当我们在Flink作业监控面板上第一次看到某个TaskManager的CPU使用率持续飙高至98%,而其余并行子任务却在“悠闲地”等待数据——那不是负载均衡,那是数据世界的“马太效应”正在悄然上演。它不声不响,却足以让一个本可线性扩展的实时管道,在吞吐量临界点前轰然失速;它不显山露水,却能让端到端延迟从毫秒级滑向秒级,甚至触发背压雪崩。这不是硬件瓶颈,不是代码缺陷,更非配置失误——这是数据倾斜(Data Skew),Flink系统中最具欺骗性的性能幽灵:它不违反任何API契约,不抛出任何异常,却单方面撕毁了分布式计算最根本的隐含协议——键空间上的均匀性假设。