3.3.2 行操作:Filter Rows, Unique Rows, Sort Rows, Group By, Split Fields 在Kettle(即Pentaho Data Integration, PDI)这一强大而灵活的ETL(Extract, Transform, Load)工具体系中,“行操作”构成了数据转换逻辑的核心骨架。如果说字段映射是数据流动的“血管”,那么行操作便是调控血液流向与质量的“心脏瓣膜”。本章聚焦于3.3.2节所列五类关键行操作组件:Filter Rows(过滤行)、Unique Rows(去重行)、Sort Rows(排序行)、Group By(分组聚合)、Split Fields(拆分字段)。