

→一幅图像是怎么形成的
通过光敏传感器来获取图像,光敏传感器可以获取图像的场景元素,场景元素经过成像系统得到数字化的图像。描述传感器的性能包括传感器的单元数、尺寸以及性能
多数传感器的输出是连续的电压波形,图像数字化是将连续色调的图像转换为计算机能够处理的数字影像的过程。图像数字化包括两种处理过程:采样和量化。




灰度图像的表示是在样本点上标注它的灰度值,0表示最暗,255表示最亮。


H:色相,颜色的相位角,范围0-356°,不同色相值对应不同的颜色
S:饱和度,0-1,越靠近远点,饱和度越低
V:亮度,0-1,越靠近0越暗,越尖越暗
相比于RGB,HSV所能包含的颜色空间更大,颜色更多





条件:
1、像素是否是在邻域中的
2、像素值相等或者像素值在一个灰度集合V中

通路

像素连通的应用:我们常常使用像素的连通来画出图像的轮廓
连通域

以上说的领域、连通和连通域都是像素的空间度量,那么如何度量这个空间的大小呢,这个时候需要有距离的度量。主要包括:






- 反转
- 对比度增强(中间变大两边变小)
对比度增强就是把s1-s2之间(中间部分)的灰度值映射到d1-d2这个更大的的灰度值当中,而把边缘部分的灰度值映射到一个更小的灰度值范围内,其效果就是白的地方更白,黑的地方更黑。
- 对比度压缩(中间变小两边变大)
把中间部分映射到灰度值更小的一个范围内,而两边部分映射到一个灰度值更大的范围内,达到白的地方变暗,黑的地方变亮。
- γ矫正(伽马矫正)
→当γ=1的时候,图像无变换。
→当γ>1的时候,像素值比较低的位置会被压缩,像素值高的位置会被拉伸,从而暗部压缩,亮部增强的效果。
→当γ<1的时候,像素值比较低的位置会被拉伸,像素值比较高的位置会被压缩,从而暗部增强,亮部压缩的效果。




- 直方图均衡化
直方图的均衡化可以有效改善图像有过暗、过亮、或者不清晰的点
这幅图中暗的部分有提亮效果,从而显示出草丛细节部分- 直方图规定化:对特定部分的调整


- 均值滤波
去噪声、图像模糊
- 高斯滤波
- 中值滤波
模板排序(中位数)滤波器的一种,有降噪、保持图像锐度

边缘检测

Prewitt梯度算子、Sobel梯度算子:主要提取的的图像的横向边缘信息
Laplacian梯度算子:不仅能提取横向的边缘信息,还能提取纵向的边缘信息

图像锐化的实现
1、边缘检测
2、原图按照一定比例+边缘检测后的图像


平移

镜像


旋转


缩放

插值

仿射变换:线性变换










- 图像处理:输入和输出都是图像,也就是图像预处理的过程。这一步是为了减少图像噪声,去掉无用的信息,增强和检测有关的信息。
- 图像分析:输入的是图像,输出的是图像的特征、目标信息和感兴趣的内容。
- 图像理解:最高层次,输入的是图像分析后的结果,输出的是计算机对这幅图像的理解、这幅图像的标签。
图像处理是数字图像处理中较低层的操作。图像处理主要在像素级上进行操作,它需要处理的数据量和计算量非常大。 一副1080P的图像有超过两百万个像素点,逐像素做灰度变换需要算两百万次重复的操作。

图像分析是数字图像处理中的中层操作。它通过直方图、特征描述和分割等图像处理操作,将以像素描述的图像中感兴趣的目标转变为更简洁的数据描述。

图像理解是数字图像处理中的高层次操作。它主要对图像分析操作提取出的目标进行计算和逻辑推理操作,达到类似人类思维的理解图像内容。









我们上面介绍了四种图像识别的基本任务:图像分类、目标检测、图像分割和目标跟踪。通过对图像识别基本任务的算法进行集成应用,可以完成更为复杂的任务:文字识别、人脸识别、内容检测。



为什么要对图像进行特征提取和特征选择:
因为数字图像是非结构化数据,不方便使用模式识别的算法进行计算。所以需要把非结构haul数据转换成结构化数据。
为了将数字图像有效的转换为结构化数据,需要用到图像特征提取的技术降低数据的维度。其主要思路有:



















我们看到这个计算是有两个卷积核(粉红色有两个),所以对应两个特征图(青色),并且计算的时候,因为输入的通道有三个,所以需要对三个通道分别求单卷积后累加,并且不能忘记还要加上偏置值(最后那个1×1的红色小色块)




- 输入层:输入的图像
- 卷积层:用来提取图像的特征
- 池化层:用来降维且能保留图像的特征
- 全连接层:用于做最后的分类
- 卷积层
卷积层通过不同的特征核提取图像的局部特征信息。
不同深度卷积层提取特征,一般四层之后就可以提取到整一个目标特征了
- 池化层
池化的目的是减少图像特征图(feature map)的空间尺寸。 有时图像太大,我们需要减少训练参数的数量,因此会在随后的卷积层之间周期性地引进池化层。 池化层一般分为最大池化(max pooling)和平均池化(mean pooling)。**池化层的最常见形式是最大池化。**池化过后不仅仅减少了数据量,而且还保持了图像显著的图像特征。
最大池化例子:每一次提取卷积尺寸中最大的那个值
- 全连接层:一般在最后面
全连接层可以用来将最后得到的特征映射到线性可分的空间,通常,卷积神经网络会将末端得到的特征图平摊成一个长的列向量,经过全连接层的计算得到最终的输出层。
全连接层在整个卷积神经网络中起到“分类器”的作用。连接所有特征,将所有特征传递给具体的分类器进行分类或者回归处理,一般都使用的softmax激活函数将最终的输出数值向量化。
