U-Net: Convolutional Networks for Biomedical Image Segmentation--论文笔记

U-Net: Convolutional Networks for Biomedical Image Segmentation

资料

1.代码地址

2.论文地址

https://arxiv.org/pdf/1505.04597

3.数据集地址

论文摘要的翻译

人们普遍认为,深度网络的成功训练需要数千个带注释的训练样本。在本文中,我们提出了一种网络和训练策略,该策略依赖于数据增强的强大使用,以更有效地使用可用的注释样本。该体系结构包括捕获上下文的收缩路径和支持精确定位的对称扩展路径。我们表明,这样的网络可以从很少的图像中进行端到端训练,并且在ISBI挑战中优于先前的最佳方法(滑动窗口卷积网络),以分割电子显微镜堆栈中的神经元结构。使用在透射光显微镜图像(相位对比和DIC)上训练的相同网络,我们在这些类别中以很大的优势赢得了2015年ISBI细胞跟踪挑战赛。此外,网络速度很快。在最新的GPU上,512x512图像的分割需要不到一秒的时间。

1背景

卷积网络的典型用途是分类任务,其中图像的输出是单个类标签。然而,在许多视觉任务中,特别是在生物医学图像处理中,期望的输出应该包括定位,即,应该为每个像素分配一个类标签。此外,成千上万的训练图像在生物医学任务中通常是遥不可及的。
因此,Ciresan等人。==在滑动窗口设置中训练网络,通过在像素输入周围提供局部区域(patch)来预测每个像素的类标签。==首先,这个网络可以本地化。其次,以patch为单位的训练数据量远大于训练图像的数量。
较大的patch需要更多的最大池化层,这会降低定位精度,而较小的patch只允许网络看到很少的上下文。
在本文中,在本文中,我们构建了一个更优雅的架构,即所谓的“全卷积网络”。我们修改和扩展了这种架构,使其适用于很少的训练图像,并产生更精确的分割;具体架构看图1
在这里插入图片描述
中的主要思想是通过连续的层来补充通常的收缩网络,其中池化算子被上采样算子取代。因此,这些层增加了输出的分辨率。为了定位,从收缩路径的高分辨率特征与上采样输出相结合。然后,连续的卷积层可以根据这些信息学习组装更精确的输出。
我们架构中的一个重要修改是,在上采样部分,我们也有大量的特征通道,这允许网络将上下文信息传播到更高分辨率的层。因此,扩张路径或多或少与收缩路径对称,并产生u形建筑。网络没有任何完全连接的层,只使用每个卷积的有效部分,即分割映射只包含像素,在输入图像中可以获得完整的上下文。

该策略允许通过重叠贴图策略对任意大的图像进行无缝分割(见图2)。为了预测图像边界区域的像素,通过镜像输入图像来推断缺失的上下文。这种平铺策略对于将网络应用于大型图像非常重要,因为否则分辨率将受到GPU内存的限制。
在这里插入图片描述
对于我们的任务,可用的训练数据很少,我们通过对可用的训练图像应用弹性变形来使用过度的数据增强。这允许网络学习这种变形的不变性,而不需要在注释的图像语料库中看到这些转换。

在许多细胞分割任务中的另一个挑战是同一类触摸物体的分离;参见图3。为此,我们建议使用加权损失,其中触摸单元之间的分离背景标签在损失函数中获得较大的权重。
在这里插入图片描述

2论文的创新点

  • 我们构建了一个全卷积神经网络架构我们修改和扩展了这种架构,使其适用于很少的训练图像,并产生更精确的分割;

3 论文方法的概述

3.1 网络架构

网络体系结构如图1所示。

  • 收缩路径(左侧)
    两个3x3卷积(不填充)的重复应用组成,每个卷积后面都有一个整流线性单元(ReLU)和一个2x2 max池化操作,步幅为2,用于下采样。每一次下采样我们将特征通道的数量加倍。下采样结构图如下。
    在这里插入图片描述
    扩张路径(右侧)
    特征映射的上采样,然后进行2x2卷积(“上卷积”),将特征通道的数量减半,与收缩路径中相应裁剪的特征映射进行连接,以及两个3x3卷积,每个卷积后面都有一个ReLU。扩张路径结构图如下。
    在这里插入图片描述
    在最后一层,使用1x1卷积将每个64个组件的特征向量映射到所需的类数量。这个网络总共有23个卷积层。

3.2 训练

输入图像及其相应的分割图用于使用随机梯度下降实现来训练网络,由于没有填充卷积,输出图像比输入图像小一个恒定的边界宽度。为了最小化开销并最大限度地利用GPU内存,我们倾向于使用较大的批处理大小,从而将批处理减少到单个图像。因此,我们使用高动量(momentum=0.99),使得大量之前看到的训练样本决定当前优化步骤中的更新。
energy function 是通过结合交叉熵损失函数在最终特征映射上的逐像素softmax来计算的。softmax函数: p k ( x ) = exp ⁡ ( a k ( x ) ) / ( ∑ k ′ = 1 K exp ⁡ ( a k ′ ( x ) ) ) p_{k}(\mathbf{x})=\exp(a_{k}(\mathbf{x}))/\left(\sum_{k^{\prime}=1}^{K}\exp(a_{k^{\prime}}(\mathbf{x}))\right) pk(x)=exp(ak(x))/(k=1Kexp(ak(x))) 其中 a k ( x ) a_{k}(\mathbf{x}) ak(x) 表示 x ∈ Ω \mathbf{x}\in\Omega xΩ 在 通道 k k k中的激活 Ω ⊂ Z 2 . K \Omega\subset\mathbb{Z}^2.K ΩZ2.K表示类的数量and p k ( x ) p_k(\mathbf{x}) pk(x) 是最大似然函数。
当最大激活时的 k k k p k ( x ) ≈ 1 p_{k}(\mathbf{x})\approx1 pk(x)1
其他k时 a k ( x ) a_k(\mathbf{x}) ak(x) and p k ( x ) ≈ 0 p_k(\mathbf{x})\approx0 pk(x)0
我们预先计算每个地面真值分割的权重图,以补偿训练数据集中某类像素的不同频率,并迫使网络学习我们在触摸单元之间引入的小分离边界(见图3c和d)

在这里插入图片描述
使用形态学操作计算分离边界。然后,权重映射计算为 w ( x ) = w c ( x ) + w 0 ⋅ exp ⁡ ( − ( d 1 ( x ) + d 2 ( x ) ) 2 2 σ 2 ) w(\mathbf{x})=w_c(\mathbf{x})+w_0\cdot\exp\left(-\frac{(d_1(\mathbf{x})+d_2(\mathbf{x}))^2}{2\sigma^2}\right) w(x)=wc(x)+w0exp(2σ2(d1(x)+d2(x))2)其中 w c : Ω → R w_c:\Omega\to\mathbb{R} wc:ΩR 为平衡类频率的权值图, d 1 : Ω → R d_1:\Omega\to\mathbb{R} d1:ΩR为到最近单元格边界的距离, d 2 : Ω → R d_2:\Omega\to\mathbb{R} d2:ΩR 为到第二最近单元格边界的距离。在我们的实验中,我们设置 w 0 = 10 w_0=10 w0=10 σ ≈ 5 \sigma\approx5 σ5 .像素。

3.3 数据增强

当只有很少的训练样本可用时,数据增强对于教会网络所需的不变性和鲁棒性是必不可少的。
移位旋转不变性以及对变形灰度值变化的鲁棒性。特别是训练样本的随机弹性变形似乎是训练具有很少注释图像的分割网络的关键概念。我们在粗糙的3 × 3网格上使用随机位移向量生成平滑变形。位移从具有10个像素标准差的高斯分布中采样。然后使用双三次插值计算逐像素位移。收缩路径末端的退出层执行进一步的隐式数据扩充。

4 论文实验

我们演示了u-net在三种不同的分割任务中的应用。第一个任务是在电子显微镜记录中对神经元结构进行分割。图2显示了数据集和我们获得的分割的示例。我们提供完整的结果作为补充材料
该数据集由EM分割挑战提供,该挑战始于ISBI 2012,并且仍然对新的贡献开放。训练数据是一组30张(512x512像素)的果蝇一龄幼虫腹侧神经索(VNC)连续切片透射电镜图像。每张图像都带有相应的完整注释的细胞(白色)和膜(黑色)的地面真值分割图。测试集是公开可用的,但其分割映射是保密的。通过将预测的膜概率图发送给组织者,可以获得评估结果。评估是通过对10个不同级别的地图进行阈值化,并计算“warping error”、“Rand error”和“pixel error”来完成的。
u-net(输入数据的7个旋转版本的平均值)在没有任何进一步的预处理或后处理的情况下实现了0.0003529的翘曲误差(新的最佳分数,见表1)和0.0382的随机误差。
在这里插入图片描述
我们还将u-net应用于光显微图像的细胞分割任务。该分割任务是2014年和2015年ISBI细胞跟踪挑战的一部分。第一个数据集“PhC-U373”2包含聚丙烯酰亚胺底物上的胶质母细胞瘤-星形细胞瘤U373细胞,通过相差显微镜记录(见图4a,b和Supp. Material)。它包含35个部分注释的训练图像。在这里,我们实现了92%的平均IOU(“交集/联合”),明显优于第二优算法的83%(见表2)。第二个数据集“DIC-HeLa”3是通过差干涉对比(DIC)显微镜记录的平板玻璃上的HeLa细胞(见图3、图4c、d和Supp. Material)。它包含20个部分注释的训练图像。在这里,我们实现了77.5%的平均IOU,这明显好于第二好的算法(46%)。
在这里插入图片描述
在这里插入图片描述

5论文内一些重要的图

  • 可以和一些实验、方法进行呼应,帮助你以后快速回忆起这篇论文内容核心。
  • 你的论文方法概述也可以围绕这个图讲

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/22232.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

44-5 waf绕过 - SQL注入绕WAF方法

环境准备: 43-5 waf绕过 - 安全狗简介及安装-CSDN博客然后安装sqlilabs靶场:构建完善的安全渗透测试环境:推荐工具、资源和下载链接_渗透测试靶机下载-CSDN博客 一、双写绕过 打开sql靶场的第一关:http://127.0.0.1/sqli-labs-master/Less-1/?id=1 验证一下waf是否开启防…

C\C++内存管理(未完结)

文章目录 一.C\C内存分布二.C语言中动态内存管理方式:malloc/calloc/realloc/free三.C内存管理方式3.1.new/delete操作内置类型3.2.new和delete操作自定义类型 四.operator new与operator delete函数(重要点进行讲解)4.1. operator new与oper…

npm install 出错,‘proxy‘ config is set properly. See: ‘npm help config‘

背景 从远程clone下项目之后,使用命令 npm install 安装依赖,报错如下 意为: 报错: npm犯错!network与网络连通性有关的问题。 npm犯错!网络在大多数情况下,你背后的代理或有坏的网络设置。 npm犯错!网络 npm犯错…

spring-kafka-生产者服务搭建测试(SpringBoot整合Kafka)

文章目录 1、生产者服务搭建1.1、引入spring-kafka依赖1.2、使用Java代码创建主题分区副本1.3、发送消息 1、生产者服务搭建 1.1、引入spring-kafka依赖 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/…

KOL营销新篇章:互动式内容与线上活动如何助力品牌增长

在当今数字化时代&#xff0c;KOL营销已成为品牌推广的重点策略之一。然而&#xff0c;随着市场竞争的加剧&#xff0c;单纯依靠KOL的曝光已经不再足够&#xff0c;更多的是需要与用户进行互动&#xff0c;帮助品牌与受众建立更紧密的联系。本文将探讨KOL营销如何通过互动式内容…

《企业应用架构模式》学习指南

导读&#xff1a;企业应用包括哪些&#xff1f;它们又分别有哪些架构模式&#xff1f; 世界著名软件开发大师Martin Fowler给你答案 01什么是企业应用 我的职业生涯专注于企业应用&#xff0c;因此&#xff0c;这里所谈及的模式也都是关于企业应用的。&#xff08;企业应用还有…

怎么用NodeJS脚本实现远程控制空调

怎么用NodeJS脚本实现远程控制空调呢&#xff1f; 本文描述了使用NodeJS脚本调用HTTP接口&#xff0c;实现控制空调&#xff0c;通过不同规格的通断器&#xff0c;来控制不同功率的空调的电源。 可选用产品&#xff1a;可根据实际场景需求&#xff0c;选择对应的规格 序号设备…

MySQL从入门到高级 --- 12.事务 13.锁机制 14.日志

文章目录 第十二章 && 第十三章 && 第十四章&#xff1a;12.事务12.1 特性12.2 隔离级别 13.锁机制13.1 各存储引擎对锁的支持状况&#xff1a;13.2 锁特性13.3 MyISAM表锁13.3.1 加表锁 13.4 InnoDB行锁13.4.1 行锁特点13.4.2 行锁模式 14.日志14.1 错误日志1…

深入理解计算机系统 第三版 中文版 图5-27 p371 错漏

中文版 英文版 对照 可以看出错漏 这本书中文版很多错漏,可以配合英文版查正,不过英文版也很多错漏,所以不用太相信书本.要根据自己的理解来.

微软云计算Windows Azure(一)

目录 一、微软云计算平台二、微软云操作系统Windows Azure&#xff08;一&#xff09;Windows Azure概述&#xff08;二&#xff09;Windows Azure计算服务&#xff08;三&#xff09;Windows Azure存储服务&#xff08;四&#xff09;Windows Azure Connect&#xff08;五&…

Win 11官宣取消硬件限制,微软这次彻底服软了

上市近 3 年&#xff0c;微软寄予厚望的 Win 11 终究落了个被上代 Win 10 光环狠狠掩埋的结局。 有小伙伴儿认为是 Win 11 本身做的太烂&#xff0c;更新频繁、BUG 一堆&#xff0c;让人失去兴趣。 也有人认为&#xff0c;系统本身体验没啥大毛病&#xff0c;严苛的硬件限制才…

数据结构算法-堆排序

堆排序&#xff1a;利用堆的特性进行排序,先将数组转换为堆对象&#xff08;最大堆或最小堆&#xff09;&#xff0c;以最大堆为例&#xff0c;每次heapify之后&#xff0c;取出堆顶&#xff08;索引为0)的元素与最后一个元素交换。以后每次做同样的事情&#xff0c;只是堆的长…

Golang性能分析工具pprof--远程分析时无法定位源代码行数问题解决方案

场景 通过命令行模式的list命令&#xff0c;为了查看指标消耗在具体哪一行&#xff0c;需要源代码。但实际程序是部署在线上或者程序的源代码目录变了&#xff0c;则pprof从默认路径找不到代码&#xff0c;无法显示是哪一行的问题。 通过浏览器模式的source页面&#xff0c;有…

JUC总结3

CAS 简介 CAS的全称是“比较并交换”&#xff0c;是一种无锁的原子操作&#xff0c;其体现了乐观所的思想&#xff0c;在无锁的情况下保证线程操作共享数据的原子性。 CAS一共有3个值&#xff1a; 1、V&#xff1a;要更新的值&#xff1b; 2、E&#xff1a;预期值&#xf…

RHCE (Linux进阶) Ubuntu 操作系统安装教程

一、在官网下载iso镜像文件 下载地址&#xff1a; https://cn.ubuntu.com/download/server/step1#downloads&#xff08;下载最新的Ubuntu 20.04 LTS服务器版本&#xff09; 二、VMware安装配置过程 基本安装过程 1、新建虚拟机 2、选择典型即可 3、设置下载好的Ubuntu对应路…

Exception异常机制详细讲解

目录 一、异常1.1 什么是异常1.2 异常机制的作用1.3 常见的异常2.3 异常的分类1. Error2. Exception① 运行时异常② 编译期异常总结&#xff1a; 二、异常的处理2.1 抛出异常3.1 抛出异常语法3.2 试图捕获异常3.3 捕获异常与抛出异常的区别1. 抛出异常2.捕获异常 三、finally四…

Spring Cloud:构建高可用分布式系统的利器

摘要&#xff1a;本文将介绍Spring Cloud&#xff0c;一个基于Spring Boot的开源微服务架构工具集。我们将探讨Spring Cloud的核心组件、特性以及如何使用Spring Cloud构建高可用、分布式系统。通过本文&#xff0c;读者将了解到Spring Cloud在实现微服务架构中的应用和优势。 …

【Springcloud微服务】MybatisPlus下篇

&#x1f525; 本文由 程序喵正在路上 原创&#xff0c;CSDN首发&#xff01; &#x1f496; 系列专栏&#xff1a;Springcloud微服务 &#x1f320; 首发时间&#xff1a;2024年6月4日 &#x1f98b; 欢迎关注&#x1f5b1;点赞&#x1f44d;收藏&#x1f31f;留言&#x1f43…

24、matlab二维和三维网格(meshgrid函数)以及散点数据插值 griddata()函数

1、二维和三维网格(meshgrid函数) 语法 语法1:[X,Y] = meshgrid(x,y) 基于向量 x 和 y 中包含的坐标返回二维网格坐标。 语法2:[X,Y] = meshgrid(x) 与 [X,Y] = meshgrid(x,x) 相同,并返回网格大小为 length(x)length(x) 的方形网格坐标。 语法3:[X,Y,Z] = meshgrid(x,y,…

弘君资本炒股开户:如何看待股价波动?

在股票商场上股价的动摇无疑是投资者最为关心的话题之一&#xff0c;面临股价的起伏不定投资者往往会感到迷茫和焦虑。关于怎么看待股价动摇&#xff0c;弘君资本下面就为大家详细介绍一下。 股价动摇是股市运行的常态&#xff0c;股市是国民经济的晴雨表&#xff0c;股票价格…