9.4 常见故障场景:Broker OOM、Bookie不可用、消息堆积 9.4 常见故障场景:Broker OOM、Bookie不可用、消息堆积 在 Apache Pulsar 的生产实践中,系统的高可用性与稳定性并非天然形成,而是建立在对典型故障场景的深刻理解与系统性应对之上。作为一款以分层架构(broker 与 bookie 解耦)和持久化存储(Apache BookKeeper)为核心特征的分布式消息系统,Pulsar 在面对 Broker 内存溢出(OOM)、Bookie 节点失效以及消息堆积等常见故障时,展现出独特的复杂性与挑战性。这些故障不仅可能单独发生,更常以级联形式相互触发,形成“雪崩效应”。