多层感知机 :label: 在 :numref: 中, 我们介绍了softmax回归( :numref: ), 然后我们从零开始实现了softmax回归( :numref: ), 接着使用高级API实现了算法( :numref: ), 并训练分类器从低分辨率图像中识别10类服装。 在这个过程中,我们学习了如何处理数据,如何将输出转换为有效的概率分布, 并应用适当的损失函数,根据模型参数最小化损失。 我们已经在简单的线性模型背景下掌握了这些知识, 现在我们可以开始对深度神经网络的探索,这也是本书主要涉及的一类模型。 隐藏层 我们在 :numref: 中描述了仿射变换, 它是一种带有偏置项的线性变换。 首先,回想一下如 :numref: 中所示的softmax回归的模型架构。