著名的CNN架构 VGG-16 VGG-16 是在2014年ImageNet顶级分类比赛中达到92.7%准确率的网络。它具有以下层结构: ImageNet 层 如你所见,VGG遵循传统的金字塔架构,即一系列卷积-池化层。 ImageNet 锥体 图片来自 Researchgate ResNet ResNet 是微软研究院在2015年提出的模型家族。ResNet的主要思想是使用残差块: 图片来自 这篇论文 使用恒等映射的原因是为了让层预测前一层输出与残差块输出之间的差异——这也是为什么叫“残差”的原因。这些块更容易训练,并且可以构建包含数百个这样的块的网络(最常见的变种包括ResNet-52、ResNet-101和ResNet-152)。 你也可以认为这个网络能够根据数据集调整其复杂度。