Appearance
1. Shortcut Connection
随着网络层次的越来越深,就容易出现梯度消失或者梯度爆炸的问题,因此网络层数无法很深。残差网络(Residual Network)的出现很好的解决了这个问题。相关论文可以参考Deep Residual Learning for Image Recognition。
ResNet的主要思想是跳远连接(shortcut connection),其基本组成是残差块(building block)。残差块的结构如下:
可以跳过一个或多个网络层,上图示例是跳过了一个网络层。通过一个个残差块堆叠在一起,可以训练更深的神经网络。
2. Identity Shortcut & Projection Shortcut
- Identity Shortcut:
和 的维度一致,即 - Projection Shortcut:
和 的维度不一致,此时
如下图所示,最右边即为ResNet34的结构。其中实线连接的为identity shortcut,虚线连接的为projection shortcut。
3. Bottleneck
在上面的ResNet34结构图中,可以看到,每个building block都是两层
Bottleneck的主要思想是先使用
例如上图右边的结构,如果使用两层的