5.3.2.1 异常检测


文档摘要

5.3.2.1 异常检测 5.3.2.1 异常检测:当Z-Score在真实流式日志中集体“失明”时,我们用滑动分位数重写警报逻辑 凌晨两点十七分,生产环境告警群弹出第14条红色消息:“API成功率突降18.7%——但所有指标曲线平滑如镜”。运维同事截图发来Prometheus面板:HTTP 5xx率、P99延迟、QPS三根线稳稳并排上扬,像三条被熨斗压过的领带;而业务侧订单失败流水却在后台无声崩塌——每分钟多出237笔“支付超时未回调”的幽灵订单。这不是误报,是漏报;不是阈值设得太松,而是整个异常检测引擎,在真实世界的数据褶皱里,悄悄关掉了自己的眼睛。


发布者: 作者: 转发
评论区 (0)
U