1.2.2 转换(Transformations) Spark 核心概念之转换(Transformations)详解 Apache Spark 作为一个强大的分布式计算框架,其核心概念之一就是弹性分布式数据集(Resilient Distributed Dataset, RDD)。而对 RDD 的操作,主要分为两种类型:转换(Transformations)和行动(Actions)。 本文将深入探讨 Transformations,这是 Spark 延迟计算和构建 DAG(有向无环图)的关键组成部分。 1.2.2 转换(Transformations) 转换(Transformations)是 Spark 中 RDD 的核心操作类型之一。