U-Net语义分割系列(一):
SS-Model【5】:U-Net
U-Net语义分割系列(二):
SS-Model【6】:U2-Net
在本文中,作者提出了一种网络和训练策略,该策略依赖于对数据增强的有力使用,以更有效地利用现有的注释样本。该架构由一个捕捉上下文的收缩路径和一个实现精确定位的对称扩展路径组成。
UNet 的初衷是为了解决医学图像分割的问题,之后,UNet 凭借其突出的分割效果而被广泛应用在语义分割的各个方向(如卫星图像分割,工业瑕疵检测等)。
原论文链接:
U-Net: Convolutional Networks for Biomedical Image Segmentation
这个模型非常优雅,结构对称,全是卷积层,没有全连接。因为这个网络使用更少的数据,取得更好的效果
全卷积网络其实就是一个不断缩小特征图的卷积神经网络,只不过后面的一些层中,将pooling 层换为 unsampling 操作了。
卷积神经网络被大规模的应用在分类任务中,输出的结果是整个图像的类标签。但是 UNet 是像素级分类,输出的则是每个像素点的类别,且不同类别的像素会显示不同颜色,UNet 常常用在生物医学图像上,而该任务中图片数据往往较少。
优点
缺点
UNet 网络结构如下图所示,其网络结构是对称的,形似英文字母 U,故而被称为 UNet

就整体而言,UNet 是一个 Encoder-Decoder 的结构(与 FCN 相同),前半部分是特征提取,后半部分是上采样
以 572 × 572 572 \times 572 572×572 的单通道图像为例
下采样阶段是典型的卷积神经网络结构, 由卷积操作和下采样操作组成
用以恢复特征图的原始分辨率
目的:解决生物医学上的大图片所带来的显存需求急剧升高问题

网络中没有任何全连接层,只对特征图本身进行了卷积。这样操作就使最后得到的分割遮罩就对应于原图的每个像素,输入图片中就包含所有的上下文纹理信息。
这样的只对特征图本身进行卷积的策略就可以对任何的大图片进行无缝分割,进行 overlap-tile 策略:
这种 tiling strategy 很重要,因为它的存在,我们就可以把网络应用于大图片了。一次分割大图片的一个区域即可。训练时还可以不受GPU显存的限制。
目的:解决待分割物体占图片像素比重很大问题

需要分割的细胞紧密相连,相互 touching 的。前景部分很多,背景部分很少,所以,我们提出使用了一个加权 loss,使细胞之间的缝隙有较大的训练权重
目的:解决生物医学图像的数据非常少的问题
我们只有很少的数据用于训练。所以我们使用了大量的数据增强,对有限的数据进行了elastic deformations(弹性变形)。这一点在生物医学分割上也非常重要,这中形变非常适合生物组织,形变后也是栩栩如生的。
UNet 的优点主要有: