1.2.2.2 应用部署与编排 当 Kubernetes 的 在凌晨三点静默失败:一个被忽略的时区陷阱与可复用的防御性编排实践 凌晨2:47,告警钉钉弹窗炸开——生产环境订单服务 Pod 处于 状态,已持续 13 分钟。SRE 小组紧急响应, 输出里一行不起眼的日志像一根细针扎进眼睛: 再往下翻, 只有一行: ——脚本明明存在。GitOps 流水线刚通过,CI 构建镜像时校验过 SHA256,Artifactory 里文件清晰可见。 却空空如也。 这不是第一次。三个月内,它在三个不同集群、四套微服务中重复出现:initContainer 启动时“看不见”本该挂载的 SQL 脚本。有人重试流水线,有人手动 文件进去,有人干脆把迁移逻辑塞进主容器启动脚本里——用耦合换时间。没人深挖。