
数字1处:一个圈表示一个神经元数字2处:一个圈表示一个神经元,圈的大小表示感受野的大小,即眼睛看到的范围大,图片扫描的范围越大,眼睛看到的范围越大小,图片扫描的范围越小,眼睛看到的范围越小感受野的大小=卷积核的大小感受野的大小=卷积核的大小w卷积核的大小通常为3*3,5*5,7*7卷积核个数=通道个数特征图的值相当于从不同的角度观看图片
输出特征图的大小=卷积核的大小

image:5*5,相当于是5*5大小的图片
filter:3*3,表示卷积核的大小为3*3,即感受野为3*3
特征图=卷积核与感受野点积+bias
一次卷积后,feature map大小为
| 参数 | 含义 |
|---|---|
S | 步长 |
F | 卷积核大小 |
P | 0填充的宽度 |
W | 上一次图片宽度 |
H | 上一次图片高度 |
W
2
=
W
1
−
F
−
2
P
S
+
1
H
2
=
H
1
−
F
−
2
P
S
+
1
rgb,如果图片还有透明度属性,通道为4,为rgba
3*3*3,3*3是自己设置的大小,再乘3表示有三个通道
zero padding【0填充】VALID
SAME

stride为2,表示每次扫描一次平移2个步长
目的就是降采样subsample,减少计算负荷,内存使用,参数数量(也可防止过拟合)
减少输入图片大小也使得神经网络可以经受一点图片平移,不受位置的影响【提高泛化能力】
池化神经元没有权重值【不需要计算参数】,它只是聚合输入根据取最大或者是求均值
通常使用最大池化,因为我们就是要保留最大特征,如果用平均池化会把最大特征平均掉,特征会变得不明显,不是我们想要的结果
池化操作是对每个通道做池化,通道之前不会累加,通道之间无关【池化后,道数不变】
池化类型
最大值, 如图,最大值为5平均值,如图,平均值就为(1+2+0+1)/4=1
池化后,feature map大小为
| 参数 | 含义 |
|---|---|
S | 步长 |
F | 卷积核大小 |
W | 上一次图片宽度 |
H | 上一次图片高度 |
W
2
=
W
1
−
F
S
+
1
H
2
=
H
1
−
F
S
+
1
dropout rate,一般设置50%,在训练之后,神经元不会再被dropout1*1卷积层不会改变卷积核的大小