4.1.1.1 版本演进 4.1.1.1 版本演进:从 的“黑洞式调用”到 的确定性生命周期管理——一次真实产线 OOM 故障的逆向解剖与 RxJava 2.x 升级落地手记 凌晨两点十七分,告警钉钉群弹出第 7 条 告警。不是 CPU 爆表,不是线程阻塞,而是堆外内存持续攀升,3 小时内从 120MB 涨至 2.1GB,JVM 进程在 GC 后仍无法释放,最终被 Kubernetes OOMKilled。这不是第一次。过去三个月,它在灰度环境周期性复现——只发生在用户密集刷新“实时行情推送页”的时段,且仅影响 Android 端集成 RxJava 1.3.8 的老版本 SDK。后端日志干净得令人不安;APM 工具显示 Netty 的 分配次数暴增;