1.3.1 按粒度划分:组件级、设备级、系统级、组织级 1.3.1 按粒度划分:组件级、设备级、系统级、组织级 从“一个日志丢失”说起:如何在多层级监控体系中精准定位故障根因 凌晨三点,告警电话刺破寂静。线上核心交易系统出现偶发性失败,但监控大盘一切正常——CPU、内存、网络、磁盘,所有指标稳如泰山。运维团队翻遍了设备级日志,却找不到任何异常。而业务方的反馈却言之凿凿:“用户支付失败了三次,就在刚才。” 这,就是典型的“粒度错配”问题。 在现代分布式系统中,我们常将可观测性划分为四个层级:组件级(Component)、设备级(Device)、系统级(System) 和 组织级(Organization)。