1.2.3 行动(Actions)


文档摘要

1.2.3 行动(Actions) Spark核心概念之行动(Actions)详解与实践 在Spark的世界里,数据处理的核心抽象是弹性分布式数据集(RDD)。RDD通过一系列的转换(Transformations)操作被构建和演变,而真正触发这些转换操作执行并产生结果的,则是行动(Actions)。理解Actions在Spark中的作用和使用方式,对于高效地进行Spark应用开发至关重要。 1.2.3 行动(Actions)的核心概念 在Spark的执行模型中,RDD的转换操作是惰性求值的(Lazy Evaluation)。这意味着当我们定义了一系列的转换操作时,Spark并不会立即执行这些操作,而是会构建一个DAG(有向无环图)来描述数据的血缘关系和转换步骤。


发布者: 作者: 转发
评论区 (0)
U