5.1.1.2 Trigger 机制与资源节省 5.1.1.2 Trigger 机制与资源节省:一个被低估的“懒加载”契约——当 Kubernetes CronJob 的 成为压垮集群的隐性雪崩开关 凌晨两点十七分,告警钉钉群炸了。 不是 CPU 突增,不是 Pod OOMKilled,也不是 etcd 延迟飙升——而是 37 个 CronJob 同时处于 状态,且全部卡在 。运维同事甩来截图: 栏里清一色写着: 可这不可能。集群空闲率明明是 68%。Prometheus 里 和 曲线平滑得像湖面。我们刚做完一轮资源配额优化,连 都调到了保守模式。 问题出在哪? 不是调度器坏了。 不是节点失联了。 甚至不是应用镜像拉取失败。