2.3.2.2 背压传播机制


文档摘要

2.3.2.2 背压传播机制 2.3.2.2 背压传播机制:当“慢消费者”撕开缓冲区的假面——一个 Kafka + Flink 流水线中背压信号被静默吞没的真实故障与精准修复 凌晨两点十七分,监控告警突然沉寂——不是恢复,而是断连。 Flink 作业的 指标在 15 秒内从 98% 坠至 0%,Checkpoint 持续失败,Kafka Consumer 的 在 3 分钟内飙升至 2700 万条;而下游 Redis 写入延迟直冲 8.4 秒,P99 超过 12 秒。运维同学发来截图时附了一句:“Consumer 明明还在 poll,为啥数据像被黑洞吸走了?” 这不是高并发压测的幻觉,也不是集群资源枯竭的表象。


发布者: 作者: 转发
评论区 (0)
U