4.1.2 处理 Late Arriving Data 在流式计算的世界里,时间从来不是一条笔直向前的射线——它更像一条湍急的河流,表面奔涌不息,水下却暗流交错、漩涡频生。我们精心设计的窗口、严谨定义的事件时间(event time)、层层校验的水位线(watermark),本意是为数据建起一座座时间堤坝,让统计结果如潮汐般可预测、可复现。可现实总爱开玩笑:一张迟到三分钟的订单日志,可能让实时GMV看板在峰值时刻突然跳变;一个晚到两小时的IoT设备心跳包,足以让故障告警系统误判为“设备永久离线”;而某次跨时区航班的登机记录,在Kafka分区中因网络抖动延迟抵达,竟把“准点率”指标从98.7%生生拉低到92.