6.26.8 基于多视角深度卷积神经网络的高分辨率乳腺癌筛查

1. 介绍

1.1 乳腺癌筛查

        开发了一种新的DCN,它能够处理乳房x线摄影筛查的多个视图,并利用大分辨率图像而不缩小。将这种DCN称为多视图深度卷积网络(MV-DCN)。网络学习预测放射科医生的评估,将传入的样本分类为BI-RADS 0(“不完整”),BI-RADS 1(“正常”)或BI-RADS 2(“良性发现”)。研究了数据集大小和图像分辨率对所提出的MV-DCN筛选性能的影响,这将作为优化未来深度神经网络用于医学成像的事实上的指导方针。

        通过可视化预测进一步研究了所提出的MV-DCN的潜力。最后,在测试集的随机子集上,提出的模型几乎与放射科医生委员会提供的相同数据一样准确。此外,通过将模型的预测与放射科医生委员会的预测平均,获得了最好的结果。

2. 高分辨率多视图深度卷积神经网络 

2.1 深度卷积神经网络

        深度卷积神经网络[9],[10]是一种以图像x为输入的分类器,通常有多个通道对应不同的颜色(如RGB),输出p(y\mid x)类别上的条件概率分布。通过一系列非线性函数来完成的,函数逐渐变换输入的像素级图像。深度卷积网络区别于多层感知器的一个主要特性是,它严重依赖于卷积层和池化层,这使得网络对输入中视觉特征的局部平移保持不变。

2.2 多视图深度卷积神经网络

        自然图像的物体识别任务通常一次只涉及一个物体,相比之下,医学成像检查通常有一组视图。例如,在筛查乳房x线摄影中,获得患者每个乳房的颅尾侧(CC)和中外侧斜位(MLO)视图是标准的,结果是一组四张图像。我们将它们称为L-CC、R-CC、L-MLO和R-MLO。 

        首先,有研究使用深度自编码器的一种变体[11],[12],[13]从多个视图中进行无监督特征提取。通常用未标记的例子训练一个多视图深度神经网络,并使用这种网络的输出作为特征提取器,然后使用标准分类器。另一方面,Su等[14]提出直接构建多视图深度卷积网络进行分类。 

        Su等人[14]提出了一种MV-DCN的变体。MV-DCN分两个阶段计算输出。在第一阶段,将一些卷积层和池化层分别应用于每个视图。我们用h_v表示这种特定于视图的表示,其中 v 指的是视图的索引。这些特定于视图的表示被连接起来形成一个向量,[hL−CC; hR−CC; hL−MLO; hR−MLO],这是第二阶段的输入-一个完全连接的层,然后是一个产生输出分布p(y\mid x)的softmax层。 

        整个网络通过反向传播随机梯度下降联合训练[15]。此外,采用了许多正则化技术来避免由于训练数据集相对较小而导致的过拟合行为,例如通过随机裁剪[16]和dropout[17]进行数据增强。

2.3 高分辨率卷积神经网络

        在自然图像的目标识别和检测中,严重降低原始高分辨率图像的比例是很常见的。例如,ImageNet Challenge 2015(分类任务)中表现最好的网络的输入是一张缩小到224 × 224的图像[18]。这样做通常是为了在计算和内存方面提高计算效率,而且还因为在更高分辨率的图像上没有观察到明显的改进。它反映了自然图像的固有属性,其中感兴趣的物体通常比其他物体呈现出相对较大的部分,最重要的是它们的宏观结构,如形状、颜色和其他全局描述符。然而,在医学图像的情况下,输入图像的缩小是不可取的,特别是基于乳房x光检查的早期筛查。诊断的线索往往是一个细微的发现,只有在最初的分辨率下才能识别出来。

        为了解决处理全分辨率图像的计算问题,建议使用主动卷积和池化层。首先,在前两个卷积层中使用步长大于1的卷积层。而且,第一个池化层比其他池化层的步幅更大。因此,大大减少了网络早期特征映射的大小。虽然这种激进的卷积和池化会损失一些空间信息,但在训练过程中调整了网络的参数以最小化这些信息损失。这与输入的降尺度不同,它会无条件地丢失信息。其次,在最后一层对特征图进行平均,然后再将它们连接起来[19],而不是简单地将特征图平坦化,然后再将它们连接起来[16],[20]。这极大地降低了特定于视图的向量的维数,而没有太多(如果有的话)性能下降[21]。使用这两种方法,能够构建一个MV-DCN,它需要四个2600 × 2000像素的图像(每个视图一个)作为输入,而不需要任何降比例。

3. 相关工作

3.1 多阶段vs端到端方法

        传统上,乳腺癌筛查和病变检测分三个阶段进行:检测、分析和最终评估/管理。在第一阶段,乳房x光图像被分割成不同类型的区域,如前景(乳房)和背景。在乳房的分割区域内,第二阶段的重点是提取一组感兴趣的区域(ROI),这些区域将被更详细地检查。在第三阶段,确定每个ROI是否是恶性病变。第三阶段的结果用于对由多个视图组成的给定案例做出最终决定。

        Kooi等[29]提出使用随机森林分类器进行质量检测,然后使用DCN对每个检测到的质量进行分类。Becker等人[30]也提出了类似的方法。Akselrod-Ballin等人[31]进一步提出使用深度卷积网络进行大规模检测和分类,有可能实现端到端训练。 

3.2 数据大小

        为了避免小训练数据的问题,大多数早期的工作都采用许多小补丁或ROI进行训练,避免端到端训练。一个例外是Carneiro等人[33]的工作,他们使用了整个图像,然而,深度卷积网络在自然图像中预训练了对象识别。与这些早期的方法不同,我们使用了一个前所未有的大规模数据集,由886,437张图像组成。这使我们能够仔细研究训练数据集大小的影响。 

3.3 自然分配vs控制分配

        INBreast在良性和恶性病例之间大致达到了平衡。这种人为的平衡,或者相当于恶性病例的上采样,可能会使模型更频繁地预测一个给定的病例是恶性的,并且需要比必要的更频繁地召回。与这些早期的工作不同,在本文中,使用了完整的数据,而没有人为地平衡结果,以确保任何训练过的深度卷积网络都能紧密地反映结果的自然分布。

4. 数据预处理和增强

        对于每个图像,我们计算其像素的平均值µ和标准差σ。然后我们从每个像素减去µ,并将每个像素除以σ。此外,我们水平翻转了R-CC和R-MLO视图的图像,使乳房始终在图像的同一侧。 

        由于图像的大小不同,并且每个图像的大部分表面是空的,因此将它们裁剪为2600 × 2000像素的大小。这么做有两个原因。首先,要统一图像的大小(我们需要在训练时将它们放在小批量中),同时保持它们的规模相似;其次,避免处理不包含任何信息的背景。

5. 定量结果分析

5.1 尺度的影响

        首先,验证了之前关于需要大规模数据来充分利用深度卷积神经网络的说法。在不同大小的训练集上训练单独的网络;原始训练集的100%,50%,20%和10%,5%,2%和1%。在表III中,我们观察到分类性能随着训练样本数量的增加而提高。这说明了使用大型训练集的重要性。这与计算机视觉、自然语言处理和语音识别等许多其他领域的观察结果一致[8]。 

5.2 分辨率的影响

        使用完整的训练集,训练了具有不同输入分辨率的网络;将输入的两个维度分别缩放×1/8, ×1/4和×1/2。使用双三次插值来缩小输入。当输入分辨率明显小于原始分辨率时,由于特征映射的大小小于卷积核的大小,后期的一些卷积层无法应用。在这种情况下,直接跳过剩下的层,直到全局平均池化。如表4所示,当输入的每个维度缩小一半时,已经看到了性能的下降。随着更大幅度的缩小,性能进一步下降。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/36373.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络问题排障专题-AF网络问题排障

目录 一、数据交换基本原理 1、ARP协议工作原理 数据包如图: 2、二层交换工作原理 简述核心概念: 二层交换原理-VLAN标签 3、三层交换工作原理 二、AF各种部署模式数据转发流程 1、路由模式数据转发流程 三、分层/分组逐一案例讲解 1、问题现…

免费分享一套SpringBoot+Vue在线水果(销售)商城管理系统【论文+源码+SQL脚本】,帅呆了~~

大家好,我是java1234_小锋老师,看到一个不错的SpringBootVue在线水果(销售)商城管理系统,分享下哈。 项目视频演示 【免费】SpringBootVue在线水果(销售)商城管理系统 Java毕业设计_哔哩哔哩_bilibili【免费】SpringBootVue在线水果(销售)商…

Android高级面试_8_热修补插件化等

Android 高级面试:插件化和热修复相关 1、dex 和 class 文件结构 class 是 JVM 可以执行的文件类型,由 javac 编译生成;dex 是 DVM 执行的文件类型,由 dx 编译生成。 class 文件结构的特点: 是一种 8 位二进制字节…

探索Facebook的未来世界:数字社交的演进之路

在数字化和全球化的浪潮中,社交网络如Facebook已经成为了人们日常生活不可或缺的一部分。然而,随着技术的迅猛发展和用户需求的不断变化,Facebook正在经历着社交平台的演进之路。本文将探索Facebook的未来世界,分析数字社交的发展…

技术选型新趋势:中小型企业如何选用高效CRM“小型应用”进行客户管理

众所周知,CRM应用通过优化客户信息管理、提升销售效率、提高客户服务质量、实现市场营销自动化以及支持数据分析与决策等方面,为企业创造更大的价值,提升企业的竞争力和市场份额。 对初创型、中小型企业来说,使用合适的CRM应用至…

【LLVM】学习使用PGO优化

笔者在查看PGO优化时看到了本站的这篇文章,其中代码和命令行部分贴上了序号,且命令行带上了$符号,不便于读者调试。 遂将代码重新整理到gitee,链接在此。 汇编代码分析 目前笔者使用的llvm版本为llvm-19,主要改动发生…

RK3588编译环境配置

安装Ubuntu18.04 安装Ubuntu请参考其他教程 安装vmware-tools 如果vmware版本过低,vmware-tools安装可能会出现各种问题。 建议直接用apt-get install安装vmware-tools sudo apt-get update sudo apt-get install open-vm-tools open-vm-tools-desktop vmware-…

从CVPR 2024看域适应、域泛化最新研究进展

域适应和域泛化一直以来都是各大顶会的热门研究方向。 域适应指:当我们在源域上训练的模型需要在目标域应用时,如果两域数据分布差异太大,模型性能就有可能降低。这时可以利用目标域的无标签数据,通过设计特定方法减小域间差异&a…

Flutter笔记(一)- 安装和配置Flutter

一、下载Flutter 访问网址:https://docs.flutter.dev/get-started/install?hlzh-cn 根据电脑所使用的操作系统的平台进行选择。笔者电脑的操作系统为Windows,因此选择如图1-1的Windows图片: 图1-1 Flutter网站(一) …

国行版苹果Vision Pro即将发售 高昂定价吓退普通消费者?

2024年2月2日,苹果第一代空间计算设备Vision Pro在美国上市。6月28日,国行版苹果Vision Pro也将正式发售,别为256GB版29999元、512GB版31499元、1TB版32999元。不过从此前Vision Pro预售情况来看,Vision Pro的“杀手锏”在“价格”…

【应届应知应会】Linux常用指令

SueWakeup 个人主页:SueWakeup 系列专栏:学习技术栈 个性签名:保留赤子之心也许是种幸运吧 本文封面由 凯楠📸友情提供 目录 文件与目录管理 目录操作命令: ls [选项] [目录或文件] mkdir 文件操作命令&#xf…

多媒体本地化的五个步骤

多媒体本地化为试图在多个全球目的地建立市场的企业提供了许多好处。 由于多媒体并不局限于一个内容标签,因此您需要注意一些元素。 这个过程通常从翻译开始,但因为我们处理的是视频和音频,所以从一开始就要处理一个附加层。让我们从这里开…

SqlServer 2008远程过程调用失败,错误代码[0x800706be]

1、解决方式: 将SQL 2008 R2升级到SP1或SP2 下载地址:SQL Server 2008 R2 Service Pack 2下载地址

非最大值抑制(NMS)函数

非最大值抑制(NMS)函数 flyfish 非最大值抑制(Non-Maximum Suppression, NMS)是计算机视觉中常用的一种后处理技术,主要用于目标检测任务。其作用是从一组可能存在大量重叠的候选边界框中,筛选出最具代表…

初学51单片机之长短键应用定时炸弹及扩展应用

51单片机RAM区域划分 51单片机的RAM分为两个部分,一块是片内RAM,一块是片外RAM。 data: 片内RAM从 0x00 ~0x7F 寻址范围(0-127) 容量共128B idata: 片外RAM从 0x00~0xFF 寻址范围(0-255) 容量共256B pdata&am…

定位问题6.27 petal数据接口问题

petal接口响应结果 响应结果为空的数据,而我们需要的是正确的响应结果。 排查问题 确认接口是否正确 以下是爬虫的配置文件内容,我查看了PETAL_URL的接口,并询问接口开发人员,得知接口地址并未改变 确认接口请求体是否正确 我使…

记一次对ouija渗透测试c语言逆向学习

概要 初始知识 web应用枚举 二进制逆向 文件枚举 堆栈溢出 学到知识 hash长度攻击 任意文件读取 二进制逆向分析 信息收集 端口扫描 nmap --min-rate 1000 -p- 10.129.30.104 发现22,80,3000端口 网站探测 目录枚举 feroxbuster -u http://10.1…

“数字政协”平台如何提高政协工作效率?正宇软件助力建设!

随着信息技术的飞速发展,数字化已成为推动各行各业转型升级的重要力量。在政协工作中,数字政协平台的建设与运用,正成为提高政协工作效率、促进民主协商的重要手段。本文将从数字政协平台的功能特点、优势分析以及实践应用等方面,…

何用Vue3和Plotly.js打造交互式3D图

本文由ScriptEcho平台提供技术支持 项目地址:传送门 利用 Plotly.js 创建交互式动画图表 应用场景 本代码适用于需要创建交互式动画图表的数据可视化项目。例如,可以用来展示时间序列数据或比较不同函数的行为。 基本功能 该代码使用 Plotly.js 库…

架构师篇-5、架构语言-ArchiMate

内容摘要: TOGAF内容元模型TOGAF架构语言ArchiMate3ArchiMate实践案例分享 TOGAF内容框架【核心内容元模型】 作为一个通用且开放式的标准,TOGAF需要采用一种非常灵活的方式来对其内容元模型进行定义,从而使得不同的企业可以根据自身需要对…