2.2.2 可观测性:指标(Prometheus)、日志(CLS)、链路(APM)三位一体采集


文档摘要

2.2.2 可观测性:指标(Prometheus)、日志(CLS)、链路(APM)三位一体采集 凌晨两点十七分,告警钉钉群弹出第7条红色消息: 值班工程师老陈没点开 Grafana 面板,也没翻 APM 的 Trace 列表——他手指悬停在键盘上三秒,敲下一行命令: 三秒后,终端返回: 他眯起眼—— 和 数值相同,说明所有 500 错误都卡在 区间;而 为 0,意味着没有一个请求能在 1 秒内失败。这不是瞬时超时,是阻塞型失败。 他立刻切到日志平台(CLS),输入查询语句: 日志里反复出现这一行: 再查 APM(腾讯云 APM)中一条典型 trace: 入口耗时 4.2s 其中 调用耗时 4.


发布者: 作者: 转发
评论区 (0)
U