10.2.1 指标采集(Prometheus) 10.2.1 指标采集(Prometheus):从数据源头到时序存储的精密工程实践 你有没有想过,当 Prometheus 在凌晨三点准时拉取你服务的 端点时,它究竟在做什么?不是简单地发一个 HTTP GET 请求——那只是冰山一角。真正的动作发生在毫秒级的时间窗口里:DNS 解析是否复用?连接池是否复位?TLS 握手是否缓存?响应体流式解析时如何避免内存暴涨?指标反序列化后,如何在不阻塞采集循环的前提下完成样本去重、时间戳对齐、标签归一化与时间序列键哈希计算?更进一步,当目标实例返回 ,Prometheus 是立即标记为 DOWN,还是等待连续三次失败才触发状态切换?它的重试退避策略是线性增长,还是指数退避?