卷积神经网络基本概念

在这里插入图片描述

1. 感受野

感受野：表示扫描图片的范围大小
- 感受野越大，图片扫描的范围越大，眼睛看到的范围越大
- 感受野越小，图片扫描的范围越小，眼睛看到的范围越小
感受野的大小=卷积核的大小

特征图的值相当于从不同的角度观看图片
输出特征图的大小=卷积核的大小
image:5*5,相当于是5*5大小的图片
filter:3*3,表示卷积核的大小为3*3,即感受野为3*3
特征图=卷积核与感受野点积+bias
- 例如计算4的过程
  $\begin{aligned} x & = x 1 * y 1 + x 2 * y 2 + x 3 * y 3 + x 4 * y 4 + x 5 * y 5 + x 6 * y 6 + x 7 * y 7 + x 8 * y 8 + x 9 * y 9 + b i a s \\ = 1 + 0 + 1 + 0 + 1 + 0 + 0 + 0 + 1 + 0 \\ = 4 \end{aligned}$
一次卷积后，feature map大小为

\begin{aligned} W_{2} & = \frac{W_{1} - F - 2 P}{S} + 1 \\ H_{2} & = \frac{H_{1} - F - 2 P}{S} + 1 \end{aligned}

W_{2} H_{2} = \frac{W _{1} - F - 2 P}{S} + 1 = \frac{H _{1} - F - 2 P}{S} + 1

1个图片的通道有3个，分别为rgb,如果图片还有透明度属性，通道为4，为rgba
一个通道有一个2维的卷积核
如图，1个图片有三个通道，分别为x[:,:,0],x[:,:,1],x[:,:,2]
一个通道有一个2维卷积核，上图的卷积核大小为3*3*3，3*3是自己设置的大小，再乘3表示有三个通道
卷积核个数自己设置，上图设置了2个卷积核
上图中6的计算步骤
$\begin{aligned} x & = x w + b i a s \\ = x [:, :, 0] * w + x [:, :, 1] * w + x [:, :, 2] * w + b i a s \\ = (0 + 0 + 0 + 0 + 0 + 0 + 0 + 2 + 2) + (0 + 0 + 0 + 0 + 0 + 0 + 0 + 0 + 0) + (0 + 0 + 0 + 0 + 2 + 0 + 0 - 1 + 0) + 1 \\ = 6 \end{aligned}$
卷积核会对各个通道结果做累加，不管卷积之前有几个通道，都会变成一个通道
- 即输出通道个数需要自己设置，有几个卷积核就会有几个通道，就是设置卷积核个数
三维图

\begin{aligned} W_{2} & = \frac{W_{1} - F}{S} + 1 \\ H_{2} & = \frac{H_{1} - F}{S} + 1 \end{aligned}

W_{2} H_{2} = \frac{W _{1} - F}{S} + 1 = \frac{H _{1} - F}{S} + 1

在每一次训练步骤中，每个神经元**【包括输入神经元，但是不包括输出神经元】**，有一个概率神经元被临时丢掉，意味着它将被忽视在整个这次训练步骤中，但是有可能下次再被激活
超参数dropout rate，一般设置50%，在训练之后，神经元不会再被dropout

只会改变通道数
因为1*1卷积层不会改变卷积核的大小
- 可以调整通道数，控制模型复杂度 【升维，降维】
  - 通道数比卷积前小，是对数据降维，降低模型复杂度
  - 通道数比卷积前大，是对数据升维，增加模型复杂度
- 可以当作全连接层使用【通道数就是神经元的个数】

相关阅读:
seaborn
体系结构27_多处理机（1）
Redis 要凉了？
Python音乐信息管理库之beets使用详解
学习笔记6--车辆线控系统
【Nano Framework ESP32篇】使用 LCD 屏幕
Wazuh agent的安装、注册与配置管理
MapReduce框架原理
mysql a表like b表的某个字段，mysql一个表的字段like另外一个表的字段
现在回头看，你有没有写过自己觉得比较愚蠢的代码？

原文地址：https://blog.csdn.net/m0_46926492/article/details/128000369