4.3 数据加载与预处理(torch.utils.data) 4.3 数据加载与预处理(torch.utils.data) 在深度学习模型的训练过程中,高效地加载和预处理数据是至关重要的一步。真实世界的数据往往规模庞大,格式多样,直接将其全部载入内存或以低效的方式读取都会成为训练的瓶颈。PyTorch的 模块正是为了解决这些问题而设计的,它提供了一套灵活且高效的数据加载工具。 模块的核心是两个类: 和 。理解并掌握它们的使用是进行PyTorch项目开发的基础。 4.3.1 Dataset 抽象类 是一个表示数据集的抽象类。所有自定义的数据集都应该继承自这个类。 类的主要作用是定义数据集的样本如何被访问。继承 的自定义类必须实现两个核心方法: : 这个方法应该返回数据集中的样本总数。