数据清洗 R语言数据清洗实战指南 1. 数据导入与初步探索 首先,我们需要将数据导入R环境中。R支持多种数据格式,如CSV、Excel、文本文件等。 函数用于读取CSV文件。 函数可以显示数据的结构,包括变量类型和维度。 函数提供数据的统计摘要,例如均值、中位数、最小值、最大值等。 和 函数分别显示数据的前几行和后几行,方便我们快速了解数据内容。 2. 处理缺失值 缺失值是数据清洗中常见的问题。常见的处理方法包括删除含有缺失值的行或列,以及填充缺失值。 检测缺失值: 删除缺失值: 函数可以删除包含任何缺失值的行。另一种方法是使用逻辑索引,删除特定列包含缺失值的行。 填充缺失值: 使用均值/中位数填充: 参数告诉 和 函数忽略缺失值。