卷积神经网络 我们之前已经了解到,神经网络在处理图像方面表现得相当不错,即使是一层感知器也能以合理准确度识别MNIST数据集中的手写数字。然而,MNIST数据集非常特殊,所有数字都位于图像中心,这使得任务变得简单。 课前小测验 在现实生活中,我们希望能够在图片中识别出对象,而不受其在图像中确切位置的影响。计算机视觉不同于通用分类,因为当我们试图在图片中找到某个特定对象时,我们实际上是在扫描图像寻找某些特定的模式及其组合。例如,当寻找一只猫时,我们首先可能会寻找水平线,这些线条可以形成胡须,而某些胡须的组合可以告诉我们这实际上是一张猫的照片。相对位置和某些模式的存在是重要的,而不是它们在图像中的确切位置。 为了提取模式,我们将使用卷积滤波器的概念。