4.1.2.2 容器化网关部署


文档摘要

4.1.2.2 容器化网关部署 容器化网关部署中那个被所有人忽略的“健康探针盲区”:一次因 误配导致灰度流量静默丢弃的深度复盘 凌晨两点十七分,告警平台弹出第三条红色消息:“API网关集群(prod-gw-v2)可用率跌至63.2%,持续5分钟”。值班工程师老陈没点开监控大盘——他直接 ssh 进入 Kubernetes 集群,执行 ,一眼扫过去,七个 Pod,六个 ,一个 。他心头一沉:又来了。 这不是第一次。过去三个月,这个基于 Envoy 构建、用 Helm 部署在 K8s 上的容器化网关,在每次发布新版本或调整路由规则后,总会在凌晨 1:40–2:30 之间出现短暂但致命的“流量黑洞”——部分灰度请求无声无息地 503,而 Prometheus 的 指标却纹丝不动;


发布者: 作者: 转发
评论区 (0)
U