AI解读医学影像能力超越人类?BMJ综述:此类研究大多存在偏差


图片来源:Pixabay

来源:BMJ

翻译:阿金

审校:戚译引

许多研究宣称,人工智能在解读医学影像方面具备和人类专家同等甚至更强的能力。但是,BMJ 近期发表的一篇综述指出,这些研究质量堪忧,有明显的夸大成分,研究人员警告这危及上百万患者的生命安全。

他们的发现表明许多这类研究的证据质量堪忧,强调了提高研究设计和报告标准的需求。

人工智能是一个创新且发展迅速的领域,有望改善病患护理,缓解医疗服务负担过重的问题。深度学习则是人工智能的分支,在医学影像领域展现了独特的发展前景。有关深度学习的论文发表数量一直在增长,并且一些媒体在头条进行报道,大力宣扬 AI 的能力优于人类医生,为快速应用推波助澜。但是实际上,这些研究的方法和偏倚风险尚未经过详细检验。

为此,一支研究团队回顾了过去十年内发表的研究成果,比较了深度学习算法和临床专家解读医学影像的能力。他们发现,这其中只有 2 项合格的随机临床试验,和 81 项非随机研究。

  

在非随机研究中,只有 9 项属于前瞻性研究(随着时间的推移,对个体进行追踪和收集信息),并且只有 6 项在“现实世界”临床环境中进行了测试。

在比较组中,人类专家的平均人数只有 4 人,而原始数据和代码的获取(以允许对结果进行独立审查)受到严格限制。

超过三分之二(81 项中的 58 项)的研究被判定为存在高偏倚风险(研究设计存在问题,会影响结果),而对于公认的报告标准遵守情况常常很糟糕。

四分之三的研究(61 项)宣称,人工智能的表现至少能与临床医生相提并论(甚至更优秀),但只有 31 项(38%)表明需要进一步的前瞻性研究或者试验。

研究人员承认这篇综述也存在一些局限,比如可能会有遗漏的研究,而且研究只关注深度学习医学影像研究,所以结果可能无法应用于其他类型的人工智能。

无论如何,他们认为目前“存在许多明显夸大的说法,宣称人工智能的能力等同于(或者优于)临床医生,这在社会层面上给患者的安全和人口健康构成了潜在风险”。

他们还警告说:“过分夸大其词的话语很容易让媒体和公众误读这些研究,结果可能会导致不恰当的护理手段,那不一定符合患者的最佳利益。”

“要最大限度地保护患者的生命安全,最好的办法就是确保开发高质量、透明的报告证据库,并继续向前推进,”他们总结。

原文链接:

https://eurekalert.org/pub_releases/2020-03/b-co032320.php

论文信息

【标题】Artificial intelligence versus clinicians: systematic review of design, reporting standards, and claims of deep learning studies

【作者】Myura Nagendran,  Yang Chen,  Christopher A Lovejoy,  Anthony C Gordon,  Matthieu Komorowski,  Hugh Harvey,  Eric J Topol,  John P A Ioannidis,  Gary S Collins,  Mahiben Maruthappu

【期刊】BMJ

【日期】2020.03.25

【链接】https://www.bmj.com/content/368/bmj.m689 

【论文摘要】

Objective To systematically examine the design, reporting standards, risk of bias, and claims of studies comparing the performance of diagnostic deep learning algorithms for medical imaging with that of expert clinicians.

Design Systematic review.

Data sources Medline, Embase, Cochrane Central Register of Controlled Trials, and the World Health Organization trial registry from 2010 to June 2019.

Eligibility criteria for selecting studies Randomised trial registrations and non-randomised studies comparing the performance of a deep learning algorithm in medical imaging with a contemporary group of one or more expert clinicians. Medical imaging has seen a growing interest in deep learning research. The main distinguishing feature of convolutional neural networks (CNNs) in deep learning is that when CNNs are fed with raw data, they develop their own representations needed for pattern recognition. The algorithm learns for itself the features of an image that are important for classification rather than being told by humans which features to use. The selected studies aimed to use medical imaging for predicting absolute risk of existing disease or classification into diagnostic groups (eg, disease or non-disease). For example, raw chest radiographs tagged with a label such as pneumothorax or no pneumothorax and the CNN learning which pixel patterns suggest pneumothorax.

Review methods Adherence to reporting standards was assessed by using CONSORT (consolidated standards of reporting trials) for randomised studies and TRIPOD (transparent reporting of a multivariable prediction model for individual prognosis or diagnosis) for non-randomised studies. Risk of bias was assessed by using the Cochrane risk of bias tool for randomised studies and PROBAST (prediction model risk of bias assessment tool) for non-randomised studies. 

Results Only 10 records were found for deep learning randomised clinical trials, two of which have been published (with low risk of bias, except for lack of blinding, and high adherence to reporting standards) and eight are ongoing. Of 81 non-randomised clinical trials identified, only nine were prospective and just six were tested in a real world clinical setting. The median number of experts in the comparator group was only four (interquartile range 2-9). Full access to all datasets and code was severely limited (unavailable in 95% and 93% of studies, respectively). The overall risk of bias was high in 58 of 81 studies and adherence to reporting standards was suboptimal (<50% adherence for 12 of 29 TRIPOD items). 61 of 81 studies stated in their abstract that performance of artificial intelligence was at least comparable to (or better than) that of clinicians. Only 31 of 81 studies (38%) stated that further prospective studies or trials were required.

Conclusions Few prospective deep learning studies and randomised trials exist in medical imaging. Most non-randomised trials are not prospective, are at high risk of bias, and deviate from existing reporting standards. Data and code availability are lacking in most studies, and human comparator groups are often small. Future studies should diminish risk of bias, enhance real world clinical relevance, improve reporting and transparency, and appropriately temper conclusions.

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/488086.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

收藏!全国31个省市区重点产业布局!

图片&#xff1a;IC photo来源&#xff1a;世界科技创新论坛一、天津优势产业﹕航空航天、石油化工、装备制造、电子信息、生物医药、新能源新材料、轻工业、国防、现代物流、海洋经济。重点招商引资产业﹕现代服务业的高端商业和电子商务&#xff0c;研发、结算中心和企业总部…

高德sdk_联手HERE,高德进军地图海外市场 | CES 2020

升级为国民出行平台之后&#xff0c;高德地图宣布进军海外市场。1月8日&#xff0c;高德与HERE 地图共同宣布&#xff0c;基于海外地图及动态信息服务展开合作。HERE地图将为高德提供中国以外地区的地图数据及交通信息等&#xff0c;高德从而可实现为用户提供全球路径规划引导、…

养成一个新习惯,只需要这个大脑区域兴奋0.5秒

图片来源&#xff1a;Pixabay文章来源&#xff1a;达特茅斯学院翻译&#xff1a;毛千芊审校&#xff1a;张毛毛每天&#xff0c;人类和动物依靠习惯完成日常起居&#xff0c;如吃饭和睡觉。习惯使我们能不加思考地做事。当大脑开始养成一种新习惯时&#xff0c;只需半秒钟&…

android 瀑布流

最终效果图 1.item_demo5.xml <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"android:layout_width"match_parent"android:layout_height"wrap_con…

$.ajax 加了headers报错_Springboot解决Ajax跨域的三种方式

这篇文章不华丽&#xff0c;但比较实用&#xff0c;能解决不少大家实际业务中的问题。大家可以收藏起来&#xff0c;以备用时之需&#xff01;1.同源策略 1.1 含义ajax出现请求跨域错误问题&#xff0c;主要原因就是因为浏览器的“同源策略”&#xff1b;1995年&#xff0c;同…

高精度惯性传感器如何实现全球自动化愿景?

来源&#xff1a;MEMS如果农场基于丰富的传感器内容来联合利用自动化地面车辆和航空器&#xff0c;那么地面作业将更加有效&#xff1b;如果手术室能够将经典的导引技术供精密制导机械臂使用&#xff0c;那么成功率将得到保障&#xff1b;如果救援行动中能够精准定位施救人员的…

catia怎么将特征参数化_搭建商城网站怎么将页面简洁化?这三个步骤不能少

随着用户群体的年轻化&#xff0c;消费者的习惯也会开始转变&#xff0c;简洁的风格设计能帮助商家更快的吸引到用户。制作自己的商城系统来进行产品销售是常见的方式之一&#xff0c;商家需要做好自己的网站规划&#xff0c;并向开发商提出相应的要求。那么&#xff0c;今天就…

宇宙是一个图网络?「全球最聪明的人」刚刚为物理基础理论指出了全新道路...

来源&#xff1a;机器学习研究组订阅号图片来源&#xff1a;机器之心「物理学已经很长一段时间没有出现任何显著进展了。探测引力波或许算是一个&#xff0c;」斯蒂芬沃尔夫勒姆表示。「我非常希望在纯技术层面上&#xff0c;我们所做的一切能够使理论物理学重新焕发活力。尽管…

python3字典写入excel_Python玩转Excel(第2期)~这里只有干货

第1期发布之后&#xff0c;反响特别好&#xff0c;很快通过审核&#xff0c;不到2小时推荐量2600多&#xff0c;还是挺高的&#xff0c;说明大家对此版块内容还是感兴趣的&#xff0c;激发了我创作的动力。谢谢大家&#xff0c;今天加班再更新一期。一、如何创建数据的‘’粮仓…

信息通信业(ICT)十大趋势

来源&#xff1a;中国信息通信研究院&#xff0c;原文刊载于《互联网天地》2020年2期2019年12月26日&#xff0c;中国信息通信研究院在北京发布了信息通信业&#xff08;ICT&#xff09;十大趋势。这十大趋势是&#xff1a;1、5G时代起航&#xff0c;开辟数字化转型新空间2、信…

小括号教学设计导入_2020年小学教师资格证复习资料之小学课堂教学导入-教师吧...

本节内容为2020年下半年小学教师资格证考试科目二《教育教学知识与能力》小学课堂教学导入考点详解。【考点&#xff1a;小学课堂教学导入】一、课堂教学导入概述(一)教学导入的概念所谓教学导入,是指在上课之初,教师利用几分钟的时间,运用简洁的言语或行为,将学生的注意力吸引…

RPU4+1视图(转)

41视图模型概况 Kruchten 提出了一个"41"视图模型&#xff0c;从5个不同的视角包括包括逻辑试图、进程视图、物理视图、开发视图、场景视图来描述软件体系结构。每一个视图只关心系统的一个侧面&#xff0c;5个试图结合在一起才能反映系统的软件体系结构的全部…

牛客网数据开发题库_牛客网SQL题库NO.32~40

不要问为什么没有31题&#xff0c;大概被牛客吞掉了吧&#xff0c;哈哈哈哈SQL 32【简单】将employees表的所有员工的last_name和first_name拼接起来作为Name&#xff0c;中间以一个空格区分CREATE TABLE employees ( emp_no int(11) NOT NULL, birth_date date NOT NULL, firs…

VR/AR行业发展至今,它的市场规模如何

来源&#xff1a;AR工业应用全球知名研究咨询公司 Markets and Markets 2017 发布了一份研究报告&#xff0c;报告称&#xff1a;AR 市场规模将从 2016 年的 23.9 亿美金增长到 2023 年的613.9 亿美金。报告显示&#xff0c;诸如医疗保健、零售以及电商这样的行业对 AR头显不断…

为什么很难创造出新的处理器?

出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;译者 | Arvin&#xff0c;责编 | 郭芮以下为译文&#xff1a;RISC-V处理器指令集体系结构&#xff08;ISA&#xff09;的问世和最初的成功重新激发了人们对定制处理器设计的兴趣&#xff0c;但是业界现在正在努力解决…

情绪调节的自适应_如何做好情绪的管理者

积极有效的情绪管理一个人如果能够控制自己的情绪、欲望和恐惧&#xff0c;那他就胜过国王。----约翰米尔顿01情绪概述情绪和情感&#xff0c;人对客观外界事物的态度的主观体验和相应的行为反应&#xff0c;它反映的是主体需要和客观外界事物间的关系。情绪和情感两个词常可通…

科普 | 同一个世界,地图有这么多不同的表达!

来源&#xff1a;测绘学报一、地图投影的概念地球到底是什么样的&#xff1f;公元前6世纪&#xff0c;古希腊数学家毕达哥拉斯率先提出了“地圆说”。他在观察月食时&#xff0c;发现大地在月球上的投影是圆的&#xff0c;所以认为大地是完整的圆球体。他首次提出了“地球”这一…

解密脑机接口:专访CMU生物医学工程系主任贺斌

卡耐基梅隆大学生物医学工程系主任贺斌教授&#xff08;照片由本人提供&#xff09;来源&#xff1a; 知识分子撰文 | 李澄宇&#xff08;中科院神经所PI&#xff09;赵维杰&#xff08;NSR新闻编辑&#xff09;脑机接口能做什么&#xff1f;带上电极帽&#xff0c;你可以在实验…

Matlab画图技巧之消除空白

</pre>写报告或论文时,为了充分利用篇幅和实现紧凑美观,我们常常想要得到空白冗余较小的图,这在Tikz里面十分容易实现。但是在Matlab里需要做很多的工作才能达到目的。</p><p></p><p>Matlab默认的图空白十分大,看起来很别扭:</p><…

5G和北斗,交通行业新基建的正确打开方式

作者&#xff1a;湖南省交通运输厅科技信息中心 乔川龙物联网智库 整理发布转载请注明来源和出处导 读交通运输行业应该是5G先行区&#xff0c;一是符合5G的机会在于与2B垂直行业的深度融合、赋能行业转型升级和高质量发展的判断&#xff1b;二是根据交通运输行业的特点&#…