5.2.1 经典排队系统

文档摘要

5.2.1 经典排队系统在分布式系统、云原生服务、实时交易引擎乃至AI推理网关的日常运维中，我们常听到一句看似轻描淡写的断言：“这个接口慢，是因为下游服务排队了。”——可“排队”二字背后，绝非一句抱怨所能概括。它是一套严丝合缝的数学语言，是泊松过程与更新理论交织的脉搏，是服务吞吐与响应延迟之间不可回避的权衡契约。当你在Prometheus面板里看到的累积直方图陡然塌陷，当Kubernetes Horizontal Pod Autoscaler（HPA）在CPU利用率85%时仍拒绝扩容，当SLO报表中P99延迟连续三小时突破200ms红线——此时真正需要的，不是重启Pod，而是打开《排队论》的第一页，亲手推导那个被遗忘在教科书角落的Little’s Law： \[ L = \lambda