从全连接层到卷积

两个原则

平移不变性（translation invariance）：不管检测对象出现在图像中的哪个位置，神经网络的前面几层应该对相同的图像区域具有相似的反应，即为“平移不变性”。
局部性（locality）：神经网络的前面几层应该只探索输入图像中的局部区域，而不过度在意图像中相隔较远区域的关系，这就是“局部性”原则。最终，可以聚合这些局部特征，以在整个图像级别进行预测。

将输入和输出变形为矩阵（宽度、高度）

将权重变形为 4 维张量

$h_{i, j}=\sum_{k, l} w_{i, j, k, l} x_{k, l}=\sum_{a, b} v_{i, j, a, b} x_{i+a, j+b}$

其中 $v$ 是 $w$ 的重新索引， $v_{i, j, a, b} =w_{i, j, i+a, j+b}$

$h_{i, j}=\sum_{a, b} v_{i, j, a, b} x_{i+a, j+b}$ 中 $x$ 的平移应仅导致 $h$ 的平移

$v$ 不应该依赖于位置 $(i,j)$

解决方案： $v_{i, j, a, b}=v_{a,b}$

$h_{i, j}=\sum_{a, b} v_{ a, b} x_{i+a, j+b}$

这就是二维互相关（cross-correlation）

当评估 $h_{i,j}$ 时，不应使用远离 $x_{i,j}$ 的参数

解决方案：当 $|a|,|b|>\Delta$ 时，使得 $v_{a,b}=0$

$h_{i, j}=\sum_{a=-\Delta}^{\Delta} \sum_{b=-\Delta}^{\Delta} v_{a, b} x_{i+a, j+b}$