5.1 数据集选择与准备(MNIST/FashionMNIST) 5.1 数据集选择与准备(MNIST/FashionMNIST) 在任何监督学习任务中,高质量的数据集是构建成功模型的基础。图像分类尤其如此,我们需要大量的、带有正确标签的图像来训练模型识别不同的类别。本章的实战案例将聚焦于图像分类,因此,选择一个合适的入门级数据集至关重要。MNIST和FashionMNIST是两个非常流行且易于获取的数据集,非常适合初学者进行图像分类的实践。 5.1.1 数据集的重要性 想象一下,你正在教一个孩子识别猫和狗。你需要向他们展示很多猫和狗的图片,并告诉他们哪张是猫,哪张是狗。机器学习模型也是类似的。它们通过学习大量带有标签(即已知类别)的数据来识别模式,然后才能对新的、未知的数据进行预测。