2.2.2.5 文件存储格式 (STORED AS) Hive文件存储格式概述 在Hive中,文件存储格式(STORED AS)是创建表时指定数据如何物理存储的关键选项。正确选择存储格式不仅影响数据的存储效率,还直接影响查询性能和资源使用。Hive支持多种存储格式,包括文本文件(TEXTFILE)、序列文件(SEQUENCEFILE)、ORC(Optimized Row Columnar)、Parquet等。每种格式都有其特定的适用场景和性能特点。 文本文件是最简单的存储格式,通常用于数据导入导出和调试,但由于其非压缩、非列式存储的特性,查询性能较差。序列文件是一种二进制键值对存储格式,支持压缩和分割,适合处理较大的数据集。