力荐联邦学习系统,据说英伟达Clara“上架”新进展!

戳蓝字“CSDN云计算”关注我们哦!
640?wx_fmt=jpeg
作者 |  晶少
责编 | 阿秃

这是晶少本年度第二次面访Kimberly Powell,这位英伟达医疗领域的美女副总裁。

除了一贯的nice之外,更重要的一点,在深圳MICCAI 2019期间,英伟达医疗团队还带来了首个面向医学影像的隐私保护型联邦学习系统的发布以及关于Clara的最新进展。

有明确消息指出,英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员已经做到利用联合学习训练了一种用于脑肿瘤分类的神经网络,这项技术可以在医院和研究人员之间共享数据的同时,做到保护患者隐私。

据悉该模型使用了来自285例脑肿瘤患者挑战的BraTS(Multimodal Brain Tumor Segmentation)数据集。有定义表示,联合学习又被称为联邦学习,是一种机器学习方法。当使用客户端-服务器方法时,可以做到不再需要创建单个数据湖来训练模型;模型可以在本地就可得到训练,随后将得到的洞察从多台机器传输到一个中心模型中加以汇总利用。

640?wx_fmt=png

技术发展至今,我们似乎对”机器学习在医疗健康领域潜在影响巨大”达成了共识,深度学习不愧是一种从医学数据中自动提取知识的强大技术,一些计算机视觉系统也早已证明“完胜”人类放射科专家的诸多经验与能力,但由于医疗领域大量数据隐私的要求,更多病例的不同数据集并不总是可用的状态。

通俗来说,英伟达上新的这款联邦学习系统能够帮助开发者与各个企业或者机构利用分散在很多不同位置的待训练数据,针对中心深度神经网络进行训练学习,进而可以支持利用共享模型展开协作,但此过程中并不需要共享任何临床数据。

对此,以英伟达资深研究科学家Nicola Rieke为代表的研究人员在相关论文中描述道:“联邦学习在无需共享患者数据的情况下,即可实现协作与分散化的神经网络训练。其中各节点负责训练其自身的本地模型,并定期提交给参数服务器;而该服务器不断累积并聚合各自的贡献进而创建一个全局模型,分享给所有节点。”相比于数据集中式系统,联邦学习提供的方法可以在不共享机构数据的情况下实现很大的分割性能,不但可以保证极高的隐私安全性,通过模型反演还可以做到设法将数据重现。至此我们可以得出结论,联邦学习有望高效聚合各机构,从私有数据中本地习得知识,进一步提高深度模型的准确性、稳健性与通用化能力,并将广泛推动数据驱动型精准医学的进步。

据悉研发专家们为了帮助提高联盟学习的安全性,专门研究试验了使用ε-差分隐私框架的可行性。晶少了解到该框架是一种正式定义隐私损失的方法,可以借助其强大的隐私保障性来保护患者与机构数据。此外通过使用稀疏向量技术,联盟学习系统可以实现严格隐私保护,但只对模型性能产生合理范围内的影响,微小到可忽略。

谈及联邦学习系统的安全机制,英伟达医疗方面声称,关于实际的数据安全,本质上是“模型找数据,而不是数据找模型”。所谓 “模型找数据”实则保证了本地数据完成训练,也是系统的最大优势突破;训练完成的数据进行回传时,确保最少涉及隐私的数据被回传。“联邦系统涉及的隐私其实也分不同层级,在搭建这个系统的时候就给予了一定的数据隐私性考虑。训练完成后,在数据中加入一些噪点,使其变得模糊,改变了原有数据的颗粒度,让联合学习模型更加安全。”

如此看来在“联邦学习”的模式下,其实数据传输的要求是非常小的,因为只是传输了模型中非常少的一部分数据,也就是说只有这一部分数据传输是需要用到网络,而不是整个模型的数据,所以在这样的情况下,模型中少量数据进行传输会带来整个通信成本的降低。

其实对于联邦学习系统的尝试,英伟达并不是首家,业界曾经有将同样的技术应用于android和ios设备上进行键盘定制模型的训练的先例,这种尝试更多侧重图像分类应用层面,其受众量相对较多,甚至可能达到百万甚至千万的体量;相比之下,医疗行业较小众,应用量级并不大,但对底层计算资源要求较高,模型以及数据集的规模均复杂,例如3D医学影像的大小,需要更多的计算能力帮助实现。

基于此,英伟达高级研究人员提出,“这项研究可以被认为是面向可靠联合学习部署迈出的重要一步,未来希望能够在很大范围内实现数据驱动的精确性。”更重要的一点,有消息称,将来还将把联合学习系统纳入Clara平台中集成,想必此举如果实现,开发者们福利颇多。

谈及Clara平台,晶少在今年早些时间就有一篇文章“老旧的医疗设备也能“赶时髦”?“聪明”的NVIDIA Clara说:没问题!”具体讲到过,总体来看正是因为日渐复杂的数据问题,诸如量大且分散,让工作自动化成为关键;而AI技术作为研发更先进工具的重要突破口之一,英伟达Clara应对此类挑战势在必行。

640?wx_fmt=png

概括来说针对模型训练,Clara内部已经做了大量计算和训练模型的尝试;对于那些预训练的数据,完成解读也是Clara可以胜任的事情之一。此外,Clara平台实际上还提供了可扩展的AI推理功能,初创企业和医疗公司完全可以使用其进行快速和低成本的扩展。基于此Kimberly Powell表示,如今Clara平台的开发者数量增长非常迅速,从今年春季到目前,几个月的时间内,开发者的数量增加了4倍。探究其增长迅速的原因,工具集的高度模块化值得被注意。

“在Clara第一个版本中,整个工作流是提前设定好的,也就是说用现有的模型去训练现有预定好的模型;而在最新的版本中,就可以做到将自己的模型放入平台来做训练,在使用层面表现更加友好。”她补充道。

640?wx_fmt=png

另外,英伟达还整合了一些开源工具到平台中,例如医疗影像新的浏览器功能,相当于“AI助理分析工具”,可以做到从三个视角观察判断图像,从用户体验角度看更加方便。此外更重要的改善就是性能优化,尤其是在数据加载到训练过程中。如果“数据加载的时间可能比训练的时间还要长”的话,显然不给力;优化过程中英伟达还实现了自动化多GPU训练的尝试等。

采访中,NVIDIA中国高性能计算、产业AI业务总经理刘通总结道,英伟达其实希望搭建现代AI架构下的引擎。引擎涵盖不仅仅是芯片、同样还有系统以及各种各样的软件堆栈等,以此应对这种比原来计算需求强30万倍的训练目标,并在尽短的时间内完成且饱含创新,如此看来在消费级AI中,英伟达更关注数据训练、模型训练等方向。

640?wx_fmt=png

“目前我们已经进入到了一个新阶段,各个垂直行业均希望能够充分利用在AI领域的最先进技术;而在医疗领域,英伟达其中一个非常核心的使命就是让开发者工具能够更好识别医疗领域的数据,这一点非常关键。”

640?wx_fmt=png
640?wx_fmt=png

640?wx_fmt=jpeg

福利
扫描添加小编微信,备注“姓名+公司职位”,入驻【CSDN博客】,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!

640?wx_fmt=jpeg

推荐阅读:



真香,朕在看了!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/521079.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

设置线程当天十二点执行_这份JAVA多线程笔记真的是细节满满,几乎全是你工作能用到的干货...

前言1:发挥多核CPU的优势(充分利用cpu资源)如果是单线程的程序,那么在双核CPU上就浪费了50%,在4核CPU上就浪费了75%。单核CPU上所谓的”多线程”那是假的多线程,同一时间处理器只会处理一段逻辑,只不过线程之间切换得比较快&#…

java多参方法_Java中多参数方法进阶

多参数方法的问题相信很多人曾经都写过多参数的构造方法,就像下面示例的代码。当想要创建一个给全部属性赋值的实例的时候,就会利用这个多参数的构造方法。但是,当类的属性特别多的时候,你还会这么写吗?如果你写了一个…

Pod Preset玩转K8S容器时区自动配置

缘由 默认的情况,在K8S里启动一个容器,该容器的设置的时区是UTC0,但是对于很多客户而言,其主机环境并不在UTC0。例如中国客户在UTC8。如果不把容器的时区和主机主机设置为一致,则在查找日志等时候将非常不方便&#x…

泪目!连拿3份 offer,AI 程序员求职经历火爆 IT圈!

程序员,如果有一天,你突然“被裁员”会怎么样?最近在知乎上浏览,看到这样一则内容:2019年,被裁员怎么挺过来?来源:知乎:https://www.zhihu.com/question/314153857其中这…

java 静态方法_80后程序员,教你学Java核心技术:用户自定义类+静态域静态方法

用户自定义类在第3章中,已经开始编写了一些简单的类。但是,那些类都只有一个简单的main方法。现在让我们开始学习如何设计复杂应用程序所需要的各种“主力类”(workhorse class)。通常,这些类没有main方法,而有自定义的实例域和实…

容器服务kubernetes弹性伸缩高级用法

前言 近期,阿里云容器服务kubernetes发布了cluster-autoscaler的支持,开发者可以通过页面简单快捷的配置节点的弹性伸缩,支持普通实例、GPU实例以及竞价实例帮助开发者实现架构弹性和运营成本之间的博弈。阿里云容器服务kubernetes的cluster…

主进程中发生javascript错误_你知道 JavaScript 中的错误对象有哪些类型吗?

每当 JavaScript 中发生任何运行时错误时,都会引发Error对象。在许多情况下,我们还可以扩展这些标准Error对象,以创建我们自己的自定义Error对象。属性Error 对象具有2个属性name ——设置或返回错误名称。具体来说,它返回错误所属…

CSDN 1024,“猿”来在等你!

戳蓝字“CSDN云计算”关注我们哦!技术深不可测、薪资难以想象、着装招人吐槽、发量让人惊叹、笑点着实密集、情商令人堪忧......在这个你我他她它通过网络紧密互联、消息实时互通的 21 世纪,人们对身处技术至高点的程序员们仍然有着以上不接地气、呆板保…

BigData:值得了解的十大数据发展趋势

当今,世界无时无刻不在发生着变化。对于技术领域而言,普遍存在的一个巨大变化就是为大数据(Big data)打开了大门,并应用大数据技相关技术来改善各行业的业务并促进经济的发展。目前,大数据的作用已经上升到…

基于FPGA的图像Robert变换实现,包括tb测试文件和MATLAB辅助验证

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 fpga的结果导入到matlab显示: 2.算法运行软件版本 vivado2019.2 matlab2022a 3.部分核心程序 ..................................…

RabbitMQ 镜像集群配置_05

接上一篇:(企业级) RabbitMQ 普通集群配置_04 文章目录一、RabbitMQ 策略实战1. 创建RabbitMQ 策略2. ly-01节点查看创建RabbitMQ 策略3. 登录ly-02管控台查看创建RabbitMQ 策略4. 登录ly-03管控台查看创建RabbitMQ 策略二、添加队列测试2.1. 添加队列2.2. Queues菜…

2018年9月杭州云栖大会Workshop - 基于日志的安全分析实战

基于日志的安全分析实战 背景 越来越多的企业开始重视构建基于日志的安全分析与防护系统。我们会讲述如何使用日志服务从0到1收集海量日志,并从中实时筛选、甄别出可疑操作并快速分析,进一步构建安全大盘与可视化。并通过实战方式,演练覆盖…

不服OceanBase跑分?今天起可到阿里云上一战

蚂蚁金服自研数据库OceanBase登顶TPC-C榜单的消息振奋人心,同时引起国内技术圈的广泛讨论,第一个云上跑出来的数据库分数含金量如何?其他数据库有没有可能更强? 针对这些疑惑,10月24日阿里云以一种最为直接的方式作出…

张勇:新技术是阿里“五新战略”的引擎

9月19日,云栖大会再次在杭州开幕。上千位顶级学者、行业专家,来自64个国家的CEO和CTO齐聚云栖小镇。这已经是这个盛大的年度技术大会的第十年。 阿里巴巴集团CEO张勇在主论坛致辞中表示,“阿里巴巴永远是一家技术驱动,使商业有所…

钉钉视频会议

基于 DingTalk_v5.0.0.74版本制作

图书馆管理系统怎么做_亚马逊erp管理系统有免费的吗?亚马逊erp管理系统怎么免费做...

我做跨境电商也有六年的时间了,在电商这个行业也有自己的一些经验。经验也许没有其他大卖家丰富,但会将我知道的都进行分享。如果有不懂得亚马逊问题可以我(V:772024802)。我这里给大家安排一堂直播课,可以系统的帮你解决做亚马逊…

程序员去交友网站找女友,没想到找到了这个...

1024程序员节,CSDN旗下的码书商店为程序员放个“价”(10月25日截止),全场所有书籍8折,电子产品可以拥有大额优惠券,购买前可加文末客服微信领取优惠券哦卫衣原价249元,1024活动价159元&#xff…

云栖大会 | 马云提出“新制造”战略将影响全球

9月19日,马云在“2018杭州•云栖大会”全面阐释对于新制造的思考。他表示,新制造很快会对全中国乃至全世界的制造业带来席卷性的威胁和席卷性的机会,所有的制造行业所面临的痛苦将远远超出想象,新制造为企业带来新机遇。 马云还特…

流言终结者- Flutter和RN谁才是更好的跨端开发方案?

背景 论坛上很多小伙伴关心为什么闲鱼选择了Flutter而不选择其他跨端方案?站在质量的角度,高性能是一个很重的因素,我们使用Flutter重写了宝贝详情页之后,对比了Flutter和Native详情页的性能表现,结论是中高端机型上F…