8.2.1 状态 TTL 配置 在流式计算的世界里,状态不是静止的湖,而是奔涌的河——它持续接纳新数据、不断演化自身形态,也悄然积累着时间的重量。当一条Flink作业运行数月甚至数年,其背后维护的状态可能从KB级膨胀至TB级;而其中超过70%的键值对,早已失去业务语义上的活性:用户会话早已超时,订单状态早已终态,设备心跳早已中断……它们沉默地盘踞在RocksDB的SST文件中,在堆外内存里悄然呼吸,在检查点快照中反复复制。这不是冗余,这是熵增——系统自发走向混乱的必然趋势。 我们曾以为“状态即真理”,却忘了真理也有保质期。状态TTL(Time-To-Live)不是一种可选的优化策略,而是流式系统面向真实世界复杂性所必须签署的一份契约:对时间的敬畏,对资源的节制,对一致性的审慎承诺。