第10天
本节学习了FCN图像语义分割。全卷积网络是用于图像语义分割的一种框架。FCN是首个端到端(end to end)进行像素级(pixel level)预测的全卷积网络。FCN有两大明显的优点:一是可以接受任意大小的输入图像,无需要求所有的训练图像和测试图像具有固定的尺寸。二是更加高效,避免了由于使用像素块而带来的重复存储和计算卷积的问题。
1.图像语义分割是图像处理和机器视觉技术中关于图像理解的重要一环,AI领域中一个重要分支,常被应用于人脸识别、物体检测、医学影像、卫星图像分析、自动驾驶感知等领域。语义分割的目的是对图像中每个像素点进行分类。与普通的分类任务只输出某个类别不同,语义分割任务输出与输入大小相同的图像,输出图像的每个像素对应了输入图像每个像素的类别。语义在图像领域指的是图像的内容,对图片意思的理解。
2.FCN主要用于图像分割领域,是一种端到端的分割方法,是深度学习应用在图像语义分割的开山之作。通过进行像素级的预测直接得出与原图大小相等的label map。因FCN丢弃全连接层替换为全卷积层,网络所有层均为卷积层,故称为全卷积网络。有三种技术:卷积化,上采样,跳跃结构
3.网络特点
3.1不含全连接层(fc)的全卷积(fully conv)网络,可适应任意尺寸输入。
3.2增大数据尺寸的反卷积(deconv)层,能够输出精细的结果。
3.3.结合不同深度层结果的跳级(skip)结构,同时确保鲁棒性和精确性。
4.通过数据处理,数据预处理,数据加载,训练集可视化,网络构建,训练准备,模型训练,模型评估,模型推理学习了全卷积网络的工作模式。