多层感知机的从零开始实现 :label: 我们已经在 :numref: 中描述了多层感知机(MLP), 现在让我们尝试自己实现一个多层感知机。 为了与之前softmax回归( :numref: ) 获得的结果进行比较, 我们将继续使用Fashion-MNIST图像分类数据集 ( :numref: )。 初始化模型参数 回想一下,Fashion-MNIST中的每个图像由 $28 \times 28 = 784$个灰度像素值组成。 所有图像共分为10个类别。 忽略像素之间的空间结构, 我们可以将每个图像视为具有784个输入特征 和10个类的简单分类数据集。 首先,我们将[实现一个具有单隐藏层的多层感知机, 它包含256个隐藏单元]。 注意,我们可以将这两个变量都视为超参数。