4.4.2 Pipeline组件 Spark ML Pipelines 组件详解与实践 4.4.2 Pipeline 组件概述 Spark ML Pipelines 主要包含以下几种类型的组件: Transformer (转换器): Transformer 负责将一个 DataFrame 转换为另一个 DataFrame。它们不涉及从数据中学习,而是基于预定义的规则或模型进行数据转换。例如,特征缩放、特征提取、以及模型本身都可以作为 Transformer 使用。 Estimator (评估器): Estimator 用于从输入 DataFrame 中学习模型。它实现了 方法,该方法接收一个 DataFrame 并返回一个 Transformer (Model)。