4.2 描述性统计 4.2 描述性统计 描述性统计是数据分析的基础,它旨在总结和描述数据集的主要特征,而不是推断总体。通过描述性统计,我们可以更好地理解数据的中心趋势、离散程度和分布形状,为进一步的分析和建模奠定基础。 本章节将详细介绍常用的描述性统计指标,并提供相应的代码示例,帮助读者掌握如何在实际应用中使用这些指标来分析数据。 4.2.1 中心趋势 中心趋势是指数据集中数据聚集的位置。常用的中心趋势指标包括: 均值 (Mean): 所有数据的总和除以数据的个数。均值对异常值敏感。 中位数 (Median): 将数据排序后,位于中间位置的值。中位数对异常值不敏感。 众数 (Mode): 数据集中出现次数最多的值。 代码示例 (Python): 输出: 4.2.