UNext:基于 MLP 的快速医学图像分割网络

UNext

  • 会议分析
    • 摘要
    • 贡献
    • 方法
      • 整体框架
      • 1.Shifted MLP
      • 2.Tokenized MLP Stage
    • 实验
      • 1.对比实验
      • 2.消融实验
        • 2.1 模块的消融实验
        • 2.2 通道数的探索
  • 可借鉴参考

会议分析

期刊(会议)名: MICCAI 2022
会议信息: 属于顶会了
有代码: UNxet

摘要

UNet 及其最新扩展(如 TransUNet)近年来一直是领先的医学图像分割方法。然而,这些网络无法有效地用于point-of-care应用中的快速图像分割,因为它们参数繁重、计算复杂且使用缓慢。为此,我们提出了 UNeXt,它是一种基于卷积多层感知器(MLP)的图像分割网络。我们以有效的方式设计了 UNeXt,其中包括早期卷积阶段和潜在阶段的 MLP 阶段。 我们提出了一个标记化的 MLP 块,我们可以在其中有效地标记和投影卷积特征,并使用 MLP 来对表示进行建模。为了进一步提高性能,我们建议在输入 MLP 时改变输入通道,以便专注于学习局部依赖关系。在潜在空间中使用标记化 MLP 可以减少参数数量和计算复杂性,同时能够产生更好的表示以帮助分割。该网络还由各级编码器和解码器之间的跳跃连接组成。我们在多个医学图像分割数据集上测试了 UNeXt,结果表明我们将参数数量减少了 72 倍,计算复杂度降低了 68 倍,推理速度提高了 10 倍,同时还获得了比最先进的医学图像更好的分割性能分段架构。


贡献

  1. 我们提出了 UNeXt,第一个基于卷积 MLP 的图像分割网络。
  2. 我们提出了一种新颖的具有轴向位移的标记化 MLP 块,以有效地学习潜在空间的良好表示。
  3. 我们成功地提高了医学图像分割任务的性能,同时具有较少的参数、较高的推理速度和较低的计算复杂度。


方法

整体框架

在这里插入图片描述
注意:

  1. 各层的通道数为32、64、128、160、256 而不是标准的U-Net通道数,这个是降低参数量和计算量最直接的方法;
  2. 前三层用的卷积模块;后两层使用的是标记的多层感知机模块;

1.Shifted MLP

在这里插入图片描述
先横向移动,后纵向移动,这些特征在高度和宽度上按顺序移动,以诱导网络中的窗口局部性

2.Tokenized MLP Stage

在这里插入图片描述
说的和做的好像有丢丢不一样,代码学习ing, 🐕😀

实验

两个共有数据集:ISIC 2018皮肤病变分割数据集和BUSI 乳腺超声数据集
损失函数:
在这里插入图片描述

1.对比实验

详细对比了与五种模型两个数据集上Params、GFLOPs、Inference Speed、F1-Score、IoU的指标
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
作为会议文章,结果分析的很少,但是有代码,要去好好学学 😀

2.消融实验

2.1 模块的消融实验

在这里插入图片描述
消融实验主要是1 原始UNet;2 减少通道数的UNet;3 只保留前三层的UNet(也是UNeXt的前半部分);4 3+标记的多层感知机模块; 5 4+深度分离卷积做的位置编码模块; 6 5+横向偏移标记的多层感知机; 7 5+纵向偏移标记的多层感知机; 8 Proposed
可以看出来模块的添加没有带来额外的开销,并且提升效果也很显著

2.2 通道数的探索

在这里插入图片描述
全是实验,没有技巧, ;之前自己做实验的时候,也是可以发现通道数的改变是降低模型开销的最直接方法

可借鉴参考

  1. 实时护理 Point-of-care 降低参数量和计算量的切入口
    Vashist, S.K.: Point-of-care diagnostics: Recent advances and trends. Biosensors 7(4), 62 (2017)

  2. 代码: UNxet

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/71404.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【经验分享】如何使用VSCode对比两个文件

问题: 当有两个不同版本的文件,如何使用VSCode对比两个文件 解决办法 长按ctrl选择想要对比的两个文件-----右键选择将已选项进行比较----大功告成 大功告成

【LangChain系列 4】Model I/O——Prompts概述

原文地址:【LangChain系列 4】Model I/O——Prompts概述 本文速读: Prompt模版 样本选择器 Prompts简单来讲就是一组指令或文本输入,语言模型理解它的意思后,给出一个输出响应。 LangChain提供了一些模块可以让我们更方便地使…

vue 分页器组件+css动画效果

全网都找了一遍没有找到符合UI需求的分页动画,于是就主动上手了 需求: 1、分页最多显示9页,总页数最多显示无上限; 2、点击下一页的时候需要有动画效果过度,如果当前页数是当前显示最后的一页,则停了当前…

算法训练day36|贪心算法 part05(重叠区间三连击:LeetCode435. 无重叠区间763.划分字母区间56. 合并区间)

文章目录 435. 无重叠区间思路分析 763.划分字母区间思路分析代码实现思考总结 56. 合并区间思路分析 435. 无重叠区间 题目链接🔥🔥 给定一个区间的集合,找到需要移除区间的最小数量,使剩余区间互不重叠。 注意: 可以认为区间的…

第3章 【MySQL】字符集和比较规则

3.1 字符集和比较规则简介 3.1.1 字符集简介 如何存储字符串?需要建立字符与二进制数据的映射关系。建立这个关系需要: 1.把哪些字符映射成二进制数据? 2.怎么映射? 将一个字符映射成一个二进制数据的过程也叫做 编码 &#…

mybatis源码学习-3-解析器模块

1. 目录结构 XNode类: 作用:XNode 类表示XML文档中的一个节点(Element或Node),它用于封装XML节点的信息,例如标签名、属性和子节点等。使用场景:MyBatis使用 XNode 来解析XML配置文件中的各种元…

长胜证券:资本市场的含义是什么?

本钱商场是指企业和政府通过证券生意来筹集资金并进行出资活动的商场。本钱商场通常被分为两个部分:初级商场和二级商场。初级商场是新证券发行的商场,而二级商场则是已发行证券的生意商场。本钱商场的展开程度是一个国家经济展开的重要目标之一。 从宏…

详解Transformer中的Encoder

一.Transformer架构 左半边是Encoder,右半边是Decoder。 二.Vision Transformer Vision Transformer取了Transformer的左半边。包含 Input EmbeddingPositional Encoding多头注意力机制 Add & Norm(前馈网络)Feed Forward Add & Norm 2.1 Input Embe…

企业架构LNMP学习笔记4

企业服务器LNMP环境搭建: 常见的软件架构: 1)C/S: client/server 2)B/S: browser/server 不管是C还是B,都是属于客户端属于前端。那么运维人员主要是负责和管理的Server端,也统称为服务器端。为了快速的…

RetroArch 接入两个同款手柄只能识别到一个导致无法双打的问题

测试平台 设备:StationPC M3 RetroArch: 1.1.5(当前官方最新) 手柄:北通蝙蝠BD2F(XBOX360键位) 问题说明 RetroArch插入两个同款手柄/摇杆时只能识别到一个,此时两个手柄都是可以控制模拟器,但是进入游戏也都是p1,无法实现双打 解决办法 …

Window安装虚拟机+给虚拟机安装Linux

一、虚拟机下载 这里使用Virtualbox虚拟机。可以直接从官网下载:Downloads – Oracle VM VirtualBox 点击进行下载,选择window版本的。直接双击,一直下一步 进行安装 PS:安装需要开启CPU虚拟化,一般电脑都已经开启了…

最新社区团购电商小程序源码 无bug完美运营版+详细搭建部署教程

分享一个开源社区团购电商小程序源码,无bug完美运营版,含完整前后端详细搭建部署教程。 系统运营模式:整合线下社区资源,由各快递代收点、社区便利店、社区物业、业主等发起的社区微信群,推送商品信息,消费…

【数据恢复】.360勒索病毒|金蝶、用友、OA、ERP等软件数据库恢复

引言: 在当今数字化的时代,网络犯罪已经演变成了一场全球性的威胁,而 360 勒索病毒则是其中最为可怕和具有破坏性的威胁之一。这种恶意软件以其危害深远、难以防范的特点而令人震惊。本文91数据恢复将深入探讨 360 勒索病毒的可怕性&#xff…

sql:SQL优化知识点记录(九)

(1)小表驱动大表 对sql调优的分析: 排序优化: 数据库的连接方式,里面的数据尽量这样连接,尽量选择第一个方式,因为两个表的连接一共建立5次连接,第二个建立1000次连接,从…

使用spring自带的发布订阅机制来实现消息发布订阅

背景 公司的项目以前代码里面有存在使用spring自带发布订阅的代码,因此稍微学习一下如何使用,并了解一下这种实现方式的优缺点。 优点 实现方便,代码方面基本只需要定义消息体和消费者,适用于小型应用程序。不依赖外部中间件&a…

h5微传单制作教程:快速轻松制作

在当今社交媒体充斥的时代,微传单作为一种新型的宣传推广方式,成为了企业和个人在传播信息时的重要工具。h5微传单相比传统的纸质传单更加灵活多样,并且能够通过手机、平板等设备随时随地进行浏览和分享,具有很高的传播效果。下面…

SpringMVC_SSM整合

一、回顾SpringMVC访问接口流程 1.容器加载分析 容器分析 手动注册WebApplicationContext public class ServletConfig extends AbstractDispatcherServletInitializer {Overrideprotected WebApplicationContext createServletApplicationContext() {//获取SpringMVC容器An…

Python实现猎人猎物优化算法(HPO)优化卷积神经网络回归模型(CNN回归算法)项目实战

说明:这是一个机器学习实战项目(附带数据代码文档视频讲解),如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 猎人猎物优化搜索算法(Hunter–prey optimizer, HPO)是由Naruei& Keynia于2022年提出的一种最新的…

OpenCV(二十八):连通域分割

目录 1.介绍连通域分割 2.像素领域介绍 3.两遍法分割连通域 4.连通域分割函数 1.介绍连通域分割 连通域分割是一种图像处理技术,用于将图像中的相邻像素组成的区域划分为不同的连通域。这些像素具有相似的特性,如相近的灰度值或颜色。连通域分割可以…

ue5 物理场的应用

cable mat wpo particle 流体粒子 choas 破损 刚体 布料 cloud abp blueprint riggedbody 体积雾 毛发 全局的 局部的 非均匀的 连续变化的 也可以多个叠加 从全局 到 范围 除了vector还有scalar的值也就是0--1的黑白灰的值 但是最终输出的值的类型还是取决于这个 一…