2.2.1.1 转移概率矩阵 2.2.1.1 转移概率矩阵:当你的 $ P $ 矩阵开始“漏气”——一个在生产环境里被忽略的浮点归一化陷阱 你写好了状态定义,画出了状态转移图,用最大似然估计算出了每一对 $(i,j)$ 的转移频次,调用 构造了 $ P \in \mathbb{R}^{n \times n} $,再用 检查了一次——返回 。你点了运行,模型训练收敛,A/B测试指标上涨,周报里你写下:“DTMC建模完成,状态演化可解释、可预测。” 三天后,线上服务在凌晨 2:17 出现周期性超时。日志里没有异常堆栈,监控显示 CPU 和内存平稳,但某条关键路径的延迟 P99 突然从 42ms 跳到 380ms,持续 11 分钟后自行恢复。