3.2.2 文件输入:Text File Input, CSV File Input, Excel Input, JSON Input, XML Input 在数据集成与ETL(Extract, Transform, Load)工程实践中,数据输入是整个流程的起点,亦是决定后续处理质量与效率的关键环节。Pentaho Data Integration(PDI),即Kettle,作为一款开源且功能强大的ETL工具,其“文件输入”模块为各类结构化、半结构化乃至非结构化数据源提供了高度灵活、可配置的接入能力。本章聚焦于3.2.2节所涵盖的五类核心文件输入组件:Text File Input、CSV File Input、Excel Input、JSON Input与XML Input。