《Clustering Propagation for Universal Medical Image Segmentation》CVPR2024

摘要

这篇论文介绍了S2VNet,这是一个用于医学图像分割的通用框架,它通过切片到体积的传播(Slice-to-Volume propagation)来统一自动(AMIS)和交互式(IMIS)医学图像分割任务。S2VNet利用基于聚类的方法,通过将先前切片的聚类中心(centroids)作为后续切片的初始值,使用2D网络实现知识在不同切片间的传递。此外,S2VNet还能够处理多类交互,并且通过一种循环中心点聚合策略来提高对异常值的鲁棒性,并增强对先前切片线索的意识。

拟解决的问题:

  • 现有的医学图像分割解决方案通常针对自动或交互式设置,这使得在一个任务中取得的进展难以转移到另一个任务。需要为每个任务训练单独的模型,导致训练时间和参数的重复。
  • 3D网络在推理时速度慢,且在医院设备上部署困难。
  • 现有交互式解决方案仅限于处理单一前景类别,而自动方法在多类别分割方面发展迅速。

创新之处:

  • 统一框架:S2VNet能够在单一模型和一个训练会话中处理AMIS和IMIS。
  • 切片到体积传播:通过在切片间传播聚类中心,实现了知识的有效传递。
  • 多类别交互:能够同时接受多类别的用户输入,每类输入初始化一个聚类中心。
  • 循环中心点聚合:通过收集历史聚类中心并将其融合为单一向量,提高了对异常值的鲁棒性。

方法

  • K-Means Cross-Attention:使用可学习的嵌入作为查询,通过交叉注意力机制收集与特定对象相关的像素特征。
  • 聚类传播驱动的通用分割框架:通过将聚类中心的动态演化从图像级掩码解码过程扩展到体积级。
  • 交互式感知的聚类中心初始化:使用用户输入初始化聚类中心,实现用户引导的分割。
  • 自适应像素特征采样:结合多轮用户输入,通过加权和的方式更新聚类中心。
  • 循环中心点聚合:通过自注意力机制和前馈网络,将新聚类中心与历史聚类中心融合。

 Clustering:K-Means Cross-Attention是S2VNet中的核心机制,它使用K-Means的思想来更新聚类中心(queries),并聚合与特定对象相关的像素特征。

每个像素特征被分配给最近的聚类中心。这类似于K-Means聚类中的分配步骤,其中每个数据点被分配给最近的中心。

在每个切片中更新的聚类中心被用作下一个切片的初始聚类中心,这有助于在体积数据中保持一致的分割结果。

结论

S2VNet通过聚类方法和切片到体积的传播,提供了一个灵活的体积图像分割解决方案,具有显著的速度和最先进的准确性。它不仅在多类别分割中表现出色,而且在自动和交互式设置中均实现了卓越的性能。论文还指出,尽管S2VNet在自动分割中只处理预定义的类别,未来工作将探索如何处理未定义的类别。S2VNet的快速和用户友好的特性不仅可以减轻专家的工作量,还可能有助于缓解整个医疗系统的负担。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/62066.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

源码可运行-PHP注册登录源码,PHP实现登陆后才能访问页面

最近有一个项目需要实现会员注册和页面登陆后才能访问,所以简单的HTML是无法实现的,就必须通过PHP、html和Mysql来实现,先给大家看一下登录和注册页的效果图。(注册完成后会自动跳转到登录窗口,即使A用户登陆后分享了网…

性能测试常见面试问题和答案

一、有没有做过性能测试,具体怎么做的 性能测试是有做过的,不过我们那个项目的性能做得不多,公司要求也不严格。一般SE 给我们相关的性能需求,首先我们需要对性能需求进行场景分析与设计,这里,其实主要就是…

二百七十八、ClickHouse——将本月第一天所在的那一周视为第一周,无论它是从周几开始的,查询某个日期是本月第几周

一、目的 ClickHouse指标表中有个字段week_of_month,含义是这条数据属于本月第几周。 而且将本月第一天所在的那一周视为第一周,无论它是从周几开始的。比如2024-12-01是周日,即12月第一周。而2024-12-02是周一,即12月第二周 二…

【OCR】——端到端文字识别GOT-OCR2.0不香嘛?

代码:https://github.com/Ucas-HaoranWei/GOT-OCR2.0?tabreadme-ov-file 在线demo:https://huggingface.co/spaces/stepfun-ai/GOT_official_online_demo 0.前言 最早做ocr的时候,就在想如何能做一个端到端的模型,就不用先检测再…

AndroidStudio-常见界面控件

一、Button package com.example.review01import androidx.appcompat.app.AppCompatActivity import android.os.Bundle import android.widget.Button import android.widget.TextViewclass Review01Activity : AppCompatActivity() {override fun onCreate(savedInstanceStat…

网络安全中的 SOC 是什么?

当今世界,网络威胁日益增多,确保网络安全已成为各种规模企业的首要任务。网络安全讨论中经常出现的一个术语是 SOC,即安全运营中心的缩写。但网络安全中的 SOC 是什么呢? SOC在防御网络威胁、管理安全事件和全天候监控系统方面发…

智选球员:运用动态规划提升棒球队的签约效益

目录 一、签约棒球自由球员 二、分析和理解 (一)问题背景回顾 (二)目标确定 (三)约束条件分析 (四)明确输出要求 三、动态规划(Dynamic Programming)解…

Lua面向对象实现

Lua中的面向对象是通过表(table)来模拟类实现的,通过setmetatable(table,metatable)方法,将一个表设置为当前表的元表,之后在调用当前表没有的方法或者键时,会再查询元表中的方法和键,以此来实现…

航空美食新升级,光明肉业携手东航食品打造经典辣肉面新篇章

在航空餐饮日益注重品质与创新的大环境下,各大航空公司纷纷在美食领域下功夫,力求为乘客提供更加多元化、高品质的餐饮体验。近日,东航那碗面再次成为行业焦点,其经典辣肉面在光明肉业的助力下实现了“创新”升级,为乘…

在.NET 6中使用Serilog收集日志

此示例的完整详细信息:https://download.csdn.net/download/hefeng_aspnet/89998498 Serilog 是一个日志库,它提供对文件、控制台和其他几个地方的记录。它易于配置,并且具有干净且易于使用的界面。 Serilog具有无与伦比的输出目的地选择&…

STM32 HAL库开发学习5. 系统滴答定时器

STM32 HAL库开发学习5. 系统滴答定时器 一、滴答定时器概述1. 概述2. 时钟源3. 寄存器(1)控制与状态寄存器 STK_CTRL(2)重载寄存器 STK_LOAD(3)当前值寄存器 STK_VAL 二、HAL库滴答定时器初始化三、SysTick…

智慧零售时代传统供应链的痛点与数字化变革:定制开发 AI 智能名片 S2B2C 商城系统的应用与影响

摘要:本文深入探讨了智慧零售时代传统供应链所面临的痛点,分析了在该时代背景下打通线上线下渠道以及整合资源的关键需求。阐述了传统零售供应链若线上线下渠道独立、数据不流通将导致的库存管理与物流效率问题,并强调其必须进行数字化变革以…

国家信息中心单志广:智慧城市转型中的数据要素价值释放

今日,由中国电信集团主办的2024数字科技生态大会数据要素合作论坛在广州市举办。国家发改委国家信息中心信息化和产业发展部主任单志广在论坛发展主旨演讲:智慧城市转型中的数据要素价值释放,主要包括发展新形势、数据新要素、数据新产权、数…

从零开始使用GOT-OCR2.0——多模态OCR项目:微调数据集构建 + 训练(解决训练报错,成功实验微调训练)

在上一篇文章记录了GOT-OCR项目的环境配置和基于官方模型参数的基础使用。环境安装的博文快速链接: 从零开始使用GOT-OCR2.0——多模态通用型OCR(非常具有潜力的开源OCR项目):项目环境安装配置 测试使用-CSDN博客 本章在环境配置…

【在Linux世界中追寻伟大的One Piece】读者写者问题与读写锁

目录 1 -> 读者写者问题 1.1 -> 什么是读者写者问题 1.2 -> 读者写者与生产消费者的区别 1.3 -> 如何理解读者写者问题 2 -> 读写锁 2.1 -> 读写锁接口 3 -> 读者优先(Reader-Preference) 4 -> 写者优先(Writer-Preference) 1 -> 读者写者…

基于PSO粒子群优化的CNN-LSTM-SAM网络时间序列回归预测算法matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 (完整程序运行后无水印) 2.算法运行软件版本 matlab2022a 3.部分核心程序 (完整版代码包含详细中文注释和操作步骤视频&#xff09…

vxe-table 键盘操作,设置按键编辑方式,支持覆盖方式与追加方式

vxe-table 全键盘操作,按键编辑方式设置,覆盖方式与追加方式; 通过 keyboard-config.editMode 设置按键编辑方式;支持覆盖方式编辑和追加方式编辑 安装 npm install vxe-pc-ui4.3.15 vxe-table4.9.15// ... import VxeUI from v…

Java设计模式笔记(二)

十四、模版方法模式 1、介绍 1)模板方法模式(Template Method Pattern),又叫模板模式(Template Patern),在一个抽象类公开定义了执行它的方法的模板。它的子类可以按需重写方法实现,但调用将以抽象类中定义的方式进行。 2&…

ZLMediaKit+wvp (ffmpeg+obs)推拉流测试

这里使用了两种方式: ffmpeg命令和 OBS OBS推流在网上找了些基本没有说明白的, 在ZLMediaKit的issues中看到了一个好大哥的提问在此记录一下 使用OBS推流,rtmp,报鉴权失败 推流 1. ffmpeg命令推流 官方说明文档地址: 推流规则 rtsp://192.168.1.4:10554…

思科模拟器路由器的基本配置

一、实验目的 了解路由器的作用掌握路由器的基本配置方法 3、掌握路由器模块的使用和互连方式 二、实验环境 2811路由器一台,计算机两台,Console配置线一根,网线若干;本实验拓扑图如图8-1所示;计算机IP地址规划如表8-…