2.1.3 Flow 与 Stream


文档摘要

2.1.3 Flow 与 Stream 在分布式数据处理系统中,“Flow”与“Stream”这两个词早已不再是教科书里泛泛而谈的抽象概念——它们是Flink作业图的骨架,是Kafka消费者组背后的调度契约,是Spark Structured Streaming中Watermark推进的脉搏,更是你在凌晨三点排查背压时日志里反复跳动的 和 。可悲的是,太多工程师把它们当作同义词混用:写文档时说“数据流(Stream)”,画架构图时标“数据流(Flow)”,调试时却对着 和 两个API一头雾水。这不是语义洁癖,而是工程失焦的前兆。 让我们直面一个尖锐的事实:Flow 是控制平面的契约,Stream 是数据平面的实体;


发布者: 作者: 转发
评论区 (0)
U