【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(7 月 26 日论文合集)

文章目录

  • 一、分割|语义相关(7篇)
    • 1.1 Learning Transferable Object-Centric Diffeomorphic Transformations for Data Augmentation in Medical Image Segmentation
    • 1.2 Optical Flow boosts Unsupervised Localization and Segmentation
    • 1.3 Spectrum-guided Multi-granularity Referring Video Object Segmentation
    • 1.4 Unmasking Anomalies in Road-Scene Segmentation
    • 1.5 GaPro: Box-Supervised 3D Point Cloud Instance Segmentation Using Gaussian Processes as Pseudo Labelers
    • 1.6 Image Segmentation Keras : Implementation of Segnet, FCN, UNet, PSPNet and other models in Keras
    • 1.7 Towards Unifying Anatomy Segmentation: Automated Generation of a Full-body CT Dataset via Knowledge Aggregation and Anatomical Guidelines

一、分割|语义相关(7篇)

1.1 Learning Transferable Object-Centric Diffeomorphic Transformations for Data Augmentation in Medical Image Segmentation

用于医学图像分割数据增强的可转移对象中心微分变换学习

https://arxiv.org/abs/2307.13645

在这里插入图片描述
由于需要专家进行像素级注释,因此在医学图像分割中获得标记数据具有挑战性。最近的工作已经表明,用可变形变换增强感兴趣的对象可以帮助减轻这一挑战。然而,这些变换已经被全局地学习用于图像,限制了它们在数据集之间的可转移性或在图像对准困难的问题中的适用性。虽然以对象为中心的增强提供了一个很好的机会来克服这些问题,现有的作品只集中在位置和随机变换,而不考虑对象的形状变化。为此,我们提出了一种新的以对象为中心的数据增强模型,能够学习感兴趣的对象的形状变化,并在不修改图像的其余部分的情况下增强对象。我们证明了它在改善肾脏肿瘤分割时,利用从同一数据集内学习的形状变化和从外部数据集转移。

1.2 Optical Flow boosts Unsupervised Localization and Segmentation

光流增强无监督定位和分割

https://arxiv.org/abs/2307.13640

在这里插入图片描述
无监督定位和分割是长期存在的机器人视觉挑战,描述了自主机器人学习将图像分解为没有标记数据的单个对象的关键能力。这些任务是重要的,因为有限的可用性密集的图像手动注释和有前途的愿景,适应不断变化的一组对象类别在终身学习。最近的方法集中在使用视觉外观的连续性作为对象线索的空间聚类功能获得自监督Vision Transformers(ViT)。在这项工作中,我们利用运动线索,灵感来自共同的命运原则,共享类似的运动的像素往往属于同一个对象。我们提出了一个新的损失项公式,使用光流在未标记的视频,鼓励自我监督的ViT功能变得更接近对方,如果他们相应的空间位置共享类似的运动,反之亦然。我们使用所提出的损失函数来微调最初在静态图像上训练的Vision Transformers。我们的微调过程优于最先进的技术,通过线性探测无监督语义分割,而不使用任何标记的数据。该过程还证明了在无监督对象定位和语义分割基准上,原始ViT网络的性能有所提高。

1.3 Spectrum-guided Multi-granularity Referring Video Object Segmentation

基于频谱制导的多粒度参考视频对象分割

https://arxiv.org/abs/2307.13537

在这里插入图片描述
当前的参考视频对象分割(R-VOS)技术从编码的(低分辨率)视觉语言特征提取条件核以分割解码的高分辨率特征。我们发现,这会导致显著的特征漂移,分割内核在前向计算期间难以感知。这对分割核的能力产生负面影响。为了解决漂移问题,我们提出了一个频谱引导的多粒度(SgMg)的方法,该方法对编码的功能进行直接分割,并采用视觉细节,以进一步优化掩模。此外,我们提出了光谱引导的跨模态融合(SCF)执行帧内的全球交互在光谱域有效的多模态表示。最后,我们扩展SgMg执行多对象R-VOS,一个新的范例,使视频中的多个参考对象的同时分割。这不仅使R-VOS更快,而且更实用。大量的实验表明,SgMg在四个视频基准数据集上实现了最先进的性能,在Ref-YouTube-VOS上的表现超过了最接近的竞争对手2.8%。我们的扩展SgMg使多对象R-VOS,运行速度约3倍,同时保持令人满意的性能。代码可在https://github.com/bo-miao/SgMg上获得。

1.4 Unmasking Anomalies in Road-Scene Segmentation

道路场景分割中的去掩蔽异常

https://arxiv.org/abs/2307.13316

在这里插入图片描述
异常分割是驱动应用程序的一项关键任务,传统上将其视为逐像素分类问题。然而,在不考虑其上下文语义的情况下单独地推理每个像素会导致对象边界周围的高度不确定性和许多误报。我们提出了一个范式的变化,从每像素分类转移到掩模分类。我们的面具为基础的方法,Mask 2Anomaly,证明了在一个面具分类架构的异常检测方法集成的可行性。Mask 2Anomaly包括几项旨在改善掩模异常检测的技术创新:i)全局掩蔽注意力模块,用于单独地聚焦在前景和背景区域上; ii)最大化异常和已知类别之间的裕度的掩模对比学习;以及iii)用于减少假阳性的掩模细化解决方案。Mask 2Anomaly在一系列基准测试中获得了新的最先进的结果,包括每像素和组件级评估。特别是,Mask 2Anomaly将平均误报率降低了60%。Github页面:https://github.com/shyam671/Mask2Anomaly-Unmasking-Anomalies-in-Road-Scene-Segmentation。

1.5 GaPro: Box-Supervised 3D Point Cloud Instance Segmentation Using Gaussian Processes as Pseudo Labelers

GaPro:基于高斯过程的盒式监督三维点云实例分割

https://arxiv.org/abs/2307.13251

在这里插入图片描述
3D点云(3DIS)上的实例分割是计算机视觉中的一个长期挑战,其中最先进的方法主要基于完全监督。由于注释地面实况密集实例掩码是繁琐且昂贵的,解决具有弱监督的3DIS变得更加实际。在本文中,我们提出了GaPro,一个新的实例分割三维点云使用轴对齐的三维包围盒监督。我们的两步方法涉及从框注释生成伪标签,并使用所得标签训练3DIS网络。此外,我们采用自我训练策略,以进一步提高我们的方法的性能。我们设计了一个有效的高斯过程,从边界框生成伪实例掩码,并在它们重叠时解决歧义,从而产生具有不确定性值的伪实例掩码。我们的实验表明,GaPro优于以前的弱监督3D实例分割方法,并具有竞争力的性能相比,最先进的完全监督的。此外,我们证明了我们的方法的鲁棒性,我们可以通过使用我们的伪标签进行训练,使各种最先进的完全监督方法适应弱监督任务。源代码和训练模型可在https://github.com/VinAIResearch/GaPro获得。

1.6 Image Segmentation Keras : Implementation of Segnet, FCN, UNet, PSPNet and other models in Keras

图像分割KERAS:SegNet、FCN、UNET、PSPNet等模型在KERS中的实现

https://arxiv.org/abs/2307.13215

在这里插入图片描述
语义分割在计算机视觉任务中起着至关重要的作用,可以对图像进行精确的像素级理解。在本文中,我们提出了一个全面的语义分割库,其中包含流行的分割模型,如SegNet,FCN,UNet和PSPNet的实现。我们还在多个数据集上评估和比较了这些模型,为研究人员和从业人员提供了一个强大的工具集来应对各种分割挑战。

1.7 Towards Unifying Anatomy Segmentation: Automated Generation of a Full-body CT Dataset via Knowledge Aggregation and Anatomical Guidelines

走向统一的解剖分割:通过知识聚合和解剖学指南自动生成全身CT数据集

https://arxiv.org/abs/2307.13375

在这里插入图片描述
在这项研究中,我们提出了一种用于生成自动解剖分割数据集的方法,使用一个顺序过程,涉及nnU-Net为基础的伪标签和解剖引导的伪标签细化。通过结合各种碎片化的知识库,我们生成了一个数据集的全身CT扫描与142 $体素级标签为533卷提供全面的解剖覆盖,专家已经批准。我们提出的程序不依赖于人工注释在标签聚合阶段。我们使用三个补充检查来检查其合理性和有用性:人类专家评估批准了数据集,BTCV数据集上的深度学习有用性基准,其中我们在不使用其训练数据集的情况下获得了85%的骰子分数,以及医疗有效性检查。该评估程序将可扩展的自动化检查与劳动密集型的高质量专家检查相结合。除了数据集之外,我们还发布了经过训练的统一解剖分割模型,能够预测CT数据上的142 $解剖结构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/13003.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【LeetCode热题100】打卡第45天:倒数第24~20题

文章目录 【LeetCode热题100】打卡第45天:倒数第24~20题⛅前言 最佳卖股票时机含冷冻期🔒题目🔑题解 戳气球🔒题目🔑题解 零钱兑换🔒题目🔑题解 打家劫舍III🔒题目🔑题解…

opencv-25 图像几何变换04- 透视 cv2.warpPerspective()

什么是透视? 透视是一种几何学概念,用于描述在三维空间中观察物体时,由于视角的不同而产生的变形效果。在现实世界中,当我们从不同的角度或位置观察物体时,它们会呈现出不同的形状和大小。这种现象被称为透视效果。 透…

FFmpeg-两个文件mix重采样以那个为主

ffmpeg -i 2ch-44.1k.wav -i 2ch-16k.wav -filter_complex " \ [0:a][1:a]amixinputs2[aout]" \ -map [aout] -f null -ffmpeg -i 2ch-44.1k.wav -i 2ch-16k.wav -filter_complex " \ [0:a][1:a]amixinputs2[aout]" \ -map [aout] -f null -对比发现&#…

TCP网络通信编程之字节流

目录 【TCP字节流编程】 // 网络编程中,一定是server端先运行 【案例1】 【思路分析】 【客户端代码】 【服务端代码】 【结果展示】 【案例2】 【题目描述】 【注意事项】 【服务端代码】 【客户端代码】 【代码结果】 【TCP字节流编程】 // 网络编程中&a…

python刑事案卷图片转pdf

分两步,第一步是转图片,第二步是合并。 # -*- coding: utf-8 -*- import glob,os from PIL import Imagedef convert_to_pdf(path):# 打开图片文件img Image.open(path)# 将图片转换为 PDF,并保存到同名文件pdf_path os.path.splitext(path…

SVG图标,SVG symbols,SVG use标签

SVG图标,SVG symbols 项目中图标的使用,趋势是使用svg作图标的,优点如下 兼容现有图片能力前提还支持矢量 可读性好,有利于SEO与无障碍 在性能和维护性方面也比iconfont要强很多 怎么在项目中优雅的使用svg图标,下面…

minus(Oracle)集合减运算符

mysql不支持minus运算符 minus集合减运算符&#xff0c;即两个集合进行相减 举例&#xff1a;显示表格中第3-5行的内容 Oracle: select * from class01 where rownum<5 minus (select *from class01where rownum<2); 但是mysql可以使用join来模拟minus mysql使用jo…

We are the Lights 2023牛客暑期多校训练营4-L

登录—专业IT笔试面试备考平台_牛客网 题目大意&#xff1a;有n*m盏灯&#xff0c;q次操作&#xff0c;每次可以将一整行或一整列的等打开或关闭 1<n,m<1e6;1<q<1e6 思路&#xff1a;对于同一行或者同一列来说&#xff0c;只要最后一次操作时开或者关&#xff0…

PHP使用Redis实战实录2:Redis扩展方法和PHP连接Redis的多种方案

PHP使用Redis实战实录系列 PHP使用Redis实战实录1&#xff1a;宝塔环境搭建、6379端口配置、Redis服务启动失败解决方案PHP使用Redis实战实录2&#xff1a;Redis扩展方法和PHP连接Redis的多种方案 Redis扩展方法和PHP连接Redis的多种方案 一、Redis扩展方法二、php操作Redis语…

算法练习(2):牛客在线编程03 二叉树

package jz.bm;import jz.TreeNode;import java.util.*;public class bm3 {/*** BM23 二叉树的前序遍历*/public int[] preorderTraversal (TreeNode root) {ArrayList<Integer> list new ArrayList<>();preOrder(root, list);int[] res new int[list.size()];fo…

C++设计模式::代理模式(combination)-可运行

实现: 1) cImage:抽象类; cImageReal:派生类, 不可直接实例化; cImageProxy:派生代理类, 可直接实例化用来代理cImageReal; NOTICE:派生代理类用来简化对特定派生类的使用. 使用: 实例化代理类, 然后使用. 1) 设计框架 /*image.hpp*/ #pragma once #…

java8 listmap聚合后内容顺序不变

学习了groupingBy的用法&#xff0c;在处理List<Map>的数据&#xff0c;顺序会发生变化&#xff1a; 直接聚合 public static void main(String[] args){String data "[{\"codeType\":\"ALRAM\",\"code\":\"1\",\"n…

MySQL笔记——表的分组查询、表的分页查询、表的约束、数据库设计

系列文章目录 MySQL笔记——MySQL数据库介绍以及在Linux里面安装MySQL数据库&#xff0c;对MySQL数据库的简单操作&#xff0c;MySQL的外接应用程序使用说明 MySQL笔记——表的修改查询相关的命令操作 MySQL案例——多表查询以及嵌套查询​​​​​​ MySQL笔记——数据库当…

【Kafka】消息队列Kafka进阶

目录 Kafka分区机制生产者分区写入策略轮询策略随机策略&#xff08;不用&#xff09;按key分配策略乱序问题自定义分区策略 消费者组Rebalance机制消费者分区分配策略Range范围分配策略RoundRobin轮询策略Stricky粘性分配策略 Kafka副本机制producer的ACKs参数acks配置为0acks…

three.js入门二:相机的zoom参数

环境&#xff1a; threejs&#xff1a;129 &#xff08;在浏览器的控制台下输入&#xff1a; window.__THREE__即可查看版本&#xff09;vscodewindowedge 透视相机或正交相机都有一个zoom参数&#xff0c;它可以用来将相机排到的内容在canvas上缩放显示。 要点&#xff1a;…

Mysql- 存储引擎

目录 1.Mysql体系结构 2.存储引擎简介 3.存储引擎特点 InnoDB MyISAM Memory 4.存储引擎选择 1.Mysql体系结构 MySQL整体的逻辑结构可以分为4层&#xff1a; 连接层&#xff1a;进行相关的连接处理、权限控制、安全处理等操作 服务层&#xff1a;服务层负责与客户层进行…

C++设计模式笔记

设计模式 如何解决复杂性&#xff1f; 分解 核心思想&#xff1a;分而治之&#xff0c;将大问题分解为多个小问题&#xff0c;将复杂问题分解为多个简单的问题。 抽象 核心思想&#xff1a;从高层次角度讲&#xff0c;人们处理复杂性有一个通用的技术&#xff0c;及抽象。…

博客迁移说明

后续博客的迁移说明 终于&#xff0c;我还是选择了迁移博客&#xff0c;本来只想改在简介的&#xff0c;但是被官方拒了&#xff0c;遂水此篇 C某N的限制太多&#xff0c;属实被恶心到了&#xff0c;不愿继续发博客在这上面学了使用Github Page搭建自己的博客&#xff0c;后续…

redis总结

1.redis redis高性能的key-value数据库&#xff0c;支持持久化&#xff0c;不仅仅支持简单的key-value&#xff0c;还提供了list&#xff0c;set&#xff0c;zset&#xff0c;hash等数据结构的存储&#xff0c;支持数据的备份&#xff08;master-slave模式&#xff09; redis&…

ShardingSphere-Proxy水平分片详解与实战

&#x1f680; ShardingSphere &#x1f680; &#x1f332; 算法刷题专栏 | 面试必备算法 | 面试高频算法 &#x1f340; &#x1f332; 越难的东西,越要努力坚持&#xff0c;因为它具有很高的价值&#xff0c;算法就是这样✨ &#x1f332; 作者简介&#xff1a;硕风和炜&…