FCN (Fully Convolutional Networks)

[TOC]

概念辨析

语义分割:不同的目标上不同的颜色

实例分割:只关注我关心的东西(汽车,行人) 其他为背景,统一为黑色

全景分割: 语义分割和实例分割的结合

难度层层递进

全局信息与局部信息

局部信息全局信息
提取位置浅层网络中提取局部信息深层网络中提取全局信息
特点物体的几何信息比较丰富,对应的感受野较小物体的空间信息比较丰富,对应的感受野较大
目的有助于分割尺寸较小的目标,有利于提高分割精确程度有助于分割尺寸较大的目标,有利于提高分割的精确程度

论文结构

核心思想

构建 fully convolutional, 输入任意大小,并输出相应尺寸的输出。

关键点

  • skip architecture
  • 结合来自深层的语义信息和来自浅层的表征信息

先验知识

感受野

是对应原图的区域大小,而不是对应上一层

在卷积神经网络中,决定某一层输出结果中一个元素所对应的输出层的区域大小。

$ RF_{l+1} = RF_l + (kernel_size-1)\times stride$

大感受野的效果要比小感受野的效果更好。

由公式可见,stride越大,感受野越大。

但是过大的stride会使feature map保留的信息变少。

因此, 在减少stride的情况下,如何增大感受野或使其保持不变,成为了分割中的一大问题