3.2.2 实例级动态权重(基于实时RT、错误率、CPU负载的eBPF探针反馈) 3.2.2 实例级动态权重:当eBPF探针在凌晨三点告诉你——那个“健康”的实例,正在 silently throttling 你的 P99 延迟 凌晨2:47,告警钉钉弹窗炸开: 的 P99 RT 从 187ms 突跃至 1342ms,错误率同步爬升至 4.2%。SRE值班同学第一反应是扩容——可K8s HPA早把副本数拉到了上限;第二反应是查日志——但所有服务端日志都写着“200 OK”,trace里 Span Duration 却像被橡皮筋拽着一样越拉越长;第三反应是看指标面板——CPU 使用率 62%,内存 58%,网络无丢包,Prometheus 的 却在 处出现诡异断崖。