AI解读医学影像能力超越人类?BMJ综述:此类研究大多存在偏差


图片来源:Pixabay

来源:BMJ

翻译:阿金

审校:戚译引

许多研究宣称,人工智能在解读医学影像方面具备和人类专家同等甚至更强的能力。但是,BMJ 近期发表的一篇综述指出,这些研究质量堪忧,有明显的夸大成分,研究人员警告这危及上百万患者的生命安全。

他们的发现表明许多这类研究的证据质量堪忧,强调了提高研究设计和报告标准的需求。

人工智能是一个创新且发展迅速的领域,有望改善病患护理,缓解医疗服务负担过重的问题。深度学习则是人工智能的分支,在医学影像领域展现了独特的发展前景。有关深度学习的论文发表数量一直在增长,并且一些媒体在头条进行报道,大力宣扬 AI 的能力优于人类医生,为快速应用推波助澜。但是实际上,这些研究的方法和偏倚风险尚未经过详细检验。

为此,一支研究团队回顾了过去十年内发表的研究成果,比较了深度学习算法和临床专家解读医学影像的能力。他们发现,这其中只有 2 项合格的随机临床试验,和 81 项非随机研究。

  

在非随机研究中,只有 9 项属于前瞻性研究(随着时间的推移,对个体进行追踪和收集信息),并且只有 6 项在“现实世界”临床环境中进行了测试。

在比较组中,人类专家的平均人数只有 4 人,而原始数据和代码的获取(以允许对结果进行独立审查)受到严格限制。

超过三分之二(81 项中的 58 项)的研究被判定为存在高偏倚风险(研究设计存在问题,会影响结果),而对于公认的报告标准遵守情况常常很糟糕。

四分之三的研究(61 项)宣称,人工智能的表现至少能与临床医生相提并论(甚至更优秀),但只有 31 项(38%)表明需要进一步的前瞻性研究或者试验。

研究人员承认这篇综述也存在一些局限,比如可能会有遗漏的研究,而且研究只关注深度学习医学影像研究,所以结果可能无法应用于其他类型的人工智能。

无论如何,他们认为目前“存在许多明显夸大的说法,宣称人工智能的能力等同于(或者优于)临床医生,这在社会层面上给患者的安全和人口健康构成了潜在风险”。

他们还警告说:“过分夸大其词的话语很容易让媒体和公众误读这些研究,结果可能会导致不恰当的护理手段,那不一定符合患者的最佳利益。”

“要最大限度地保护患者的生命安全,最好的办法就是确保开发高质量、透明的报告证据库,并继续向前推进,”他们总结。

原文链接:

https://eurekalert.org/pub_releases/2020-03/b-co032320.php

论文信息

【标题】Artificial intelligence versus clinicians: systematic review of design, reporting standards, and claims of deep learning studies

【作者】Myura Nagendran,  Yang Chen,  Christopher A Lovejoy,  Anthony C Gordon,  Matthieu Komorowski,  Hugh Harvey,  Eric J Topol,  John P A Ioannidis,  Gary S Collins,  Mahiben Maruthappu

【期刊】BMJ

【日期】2020.03.25

【链接】https://www.bmj.com/content/368/bmj.m689 

【论文摘要】

Objective To systematically examine the design, reporting standards, risk of bias, and claims of studies comparing the performance of diagnostic deep learning algorithms for medical imaging with that of expert clinicians.

Design Systematic review.

Data sources Medline, Embase, Cochrane Central Register of Controlled Trials, and the World Health Organization trial registry from 2010 to June 2019.

Eligibility criteria for selecting studies Randomised trial registrations and non-randomised studies comparing the performance of a deep learning algorithm in medical imaging with a contemporary group of one or more expert clinicians. Medical imaging has seen a growing interest in deep learning research. The main distinguishing feature of convolutional neural networks (CNNs) in deep learning is that when CNNs are fed with raw data, they develop their own representations needed for pattern recognition. The algorithm learns for itself the features of an image that are important for classification rather than being told by humans which features to use. The selected studies aimed to use medical imaging for predicting absolute risk of existing disease or classification into diagnostic groups (eg, disease or non-disease). For example, raw chest radiographs tagged with a label such as pneumothorax or no pneumothorax and the CNN learning which pixel patterns suggest pneumothorax.

Review methods Adherence to reporting standards was assessed by using CONSORT (consolidated standards of reporting trials) for randomised studies and TRIPOD (transparent reporting of a multivariable prediction model for individual prognosis or diagnosis) for non-randomised studies. Risk of bias was assessed by using the Cochrane risk of bias tool for randomised studies and PROBAST (prediction model risk of bias assessment tool) for non-randomised studies. 

Results Only 10 records were found for deep learning randomised clinical trials, two of which have been published (with low risk of bias, except for lack of blinding, and high adherence to reporting standards) and eight are ongoing. Of 81 non-randomised clinical trials identified, only nine were prospective and just six were tested in a real world clinical setting. The median number of experts in the comparator group was only four (interquartile range 2-9). Full access to all datasets and code was severely limited (unavailable in 95% and 93% of studies, respectively). The overall risk of bias was high in 58 of 81 studies and adherence to reporting standards was suboptimal (<50% adherence for 12 of 29 TRIPOD items). 61 of 81 studies stated in their abstract that performance of artificial intelligence was at least comparable to (or better than) that of clinicians. Only 31 of 81 studies (38%) stated that further prospective studies or trials were required.

Conclusions Few prospective deep learning studies and randomised trials exist in medical imaging. Most non-randomised trials are not prospective, are at high risk of bias, and deviate from existing reporting standards. Data and code availability are lacking in most studies, and human comparator groups are often small. Future studies should diminish risk of bias, enhance real world clinical relevance, improve reporting and transparency, and appropriately temper conclusions.

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/488086.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Effective C++ 条款12

复制对象时&#xff0c;勿忘其每个成分 作者在本节条款提醒我们&#xff0c;在多重继承的情况下进行copy或者copy assignment 的operator的编写时&#xff0c;一定要考虑base 类部分数据的初始化后者复制。 对照一下代码&#xff1a; class Cutsomer { …… private:string nam…

米家电磁炉显示e10_米家电磁炉e10故障怎么回事

大家好&#xff0c;我是时间财富网智能客服时间君&#xff0c;上述问题将由我为大家进行解答。米家电磁炉e10故障即底部传感器温度高造成的&#xff0c;建议把电磁炉冷却下来再打开尝试。米家电磁炉延续了小米设备一贯的简约时尚的清新风&#xff0c;它采用了圆润的纯白色机身&…

收藏!全国31个省市区重点产业布局!

图片&#xff1a;IC photo来源&#xff1a;世界科技创新论坛一、天津优势产业﹕航空航天、石油化工、装备制造、电子信息、生物医药、新能源新材料、轻工业、国防、现代物流、海洋经济。重点招商引资产业﹕现代服务业的高端商业和电子商务&#xff0c;研发、结算中心和企业总部…

高德sdk_联手HERE,高德进军地图海外市场 | CES 2020

升级为国民出行平台之后&#xff0c;高德地图宣布进军海外市场。1月8日&#xff0c;高德与HERE 地图共同宣布&#xff0c;基于海外地图及动态信息服务展开合作。HERE地图将为高德提供中国以外地区的地图数据及交通信息等&#xff0c;高德从而可实现为用户提供全球路径规划引导、…

养成一个新习惯,只需要这个大脑区域兴奋0.5秒

图片来源&#xff1a;Pixabay文章来源&#xff1a;达特茅斯学院翻译&#xff1a;毛千芊审校&#xff1a;张毛毛每天&#xff0c;人类和动物依靠习惯完成日常起居&#xff0c;如吃饭和睡觉。习惯使我们能不加思考地做事。当大脑开始养成一种新习惯时&#xff0c;只需半秒钟&…

android 瀑布流

最终效果图 1.item_demo5.xml <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"android:layout_width"match_parent"android:layout_height"wrap_con…

$.ajax 加了headers报错_Springboot解决Ajax跨域的三种方式

这篇文章不华丽&#xff0c;但比较实用&#xff0c;能解决不少大家实际业务中的问题。大家可以收藏起来&#xff0c;以备用时之需&#xff01;1.同源策略 1.1 含义ajax出现请求跨域错误问题&#xff0c;主要原因就是因为浏览器的“同源策略”&#xff1b;1995年&#xff0c;同…

高精度惯性传感器如何实现全球自动化愿景?

来源&#xff1a;MEMS如果农场基于丰富的传感器内容来联合利用自动化地面车辆和航空器&#xff0c;那么地面作业将更加有效&#xff1b;如果手术室能够将经典的导引技术供精密制导机械臂使用&#xff0c;那么成功率将得到保障&#xff1b;如果救援行动中能够精准定位施救人员的…

链接服务器 因为它不存在或者您没有所需的权限。处理

有时候&#xff0c;我们会用 Set Identity_Insert Table ON 来处理数据表的某些自增列。如果在本地倒是没什么问题。如果是远程服务器&#xff0c;则会报 找不到对象"XXX" ,因为它不存在或者您没有所需的权限 其实这个跟你的权限无关&#xff0c;即使你链接服务器用…

catia怎么将特征参数化_搭建商城网站怎么将页面简洁化?这三个步骤不能少

随着用户群体的年轻化&#xff0c;消费者的习惯也会开始转变&#xff0c;简洁的风格设计能帮助商家更快的吸引到用户。制作自己的商城系统来进行产品销售是常见的方式之一&#xff0c;商家需要做好自己的网站规划&#xff0c;并向开发商提出相应的要求。那么&#xff0c;今天就…

宇宙是一个图网络?「全球最聪明的人」刚刚为物理基础理论指出了全新道路...

来源&#xff1a;机器学习研究组订阅号图片来源&#xff1a;机器之心「物理学已经很长一段时间没有出现任何显著进展了。探测引力波或许算是一个&#xff0c;」斯蒂芬沃尔夫勒姆表示。「我非常希望在纯技术层面上&#xff0c;我们所做的一切能够使理论物理学重新焕发活力。尽管…

HP Unix vsftp服务配置

HP Unix vsftp 服务配置&#xff1a; /opt/ssh/utils/ssh_chroot_setup.sh 运行脚本&#xff0c;会提示输入要建立的vsftp账号和要限制的家目录&#xff0c; 比如要限制的家目录为/JiaRoot/&#xff0c;则/etc/passwd 里面相应的vsftp账号家目录 /JiaRoot/./&#xff1b; 配置免…

python3字典写入excel_Python玩转Excel(第2期)~这里只有干货

第1期发布之后&#xff0c;反响特别好&#xff0c;很快通过审核&#xff0c;不到2小时推荐量2600多&#xff0c;还是挺高的&#xff0c;说明大家对此版块内容还是感兴趣的&#xff0c;激发了我创作的动力。谢谢大家&#xff0c;今天加班再更新一期。一、如何创建数据的‘’粮仓…

Network Request Failed

在react native项目中&#xff0c;有时候调用接口会出现这样的错误提示&#xff1a;“Network Request Failed”。 一.模拟器上报“Network Request Failed”解决办法&#xff0c;也是官网有提到的&#xff1a; 1. 在Info.plist中添加NSAppTransportSecurity类型Dictionary。 2…

信息通信业(ICT)十大趋势

来源&#xff1a;中国信息通信研究院&#xff0c;原文刊载于《互联网天地》2020年2期2019年12月26日&#xff0c;中国信息通信研究院在北京发布了信息通信业&#xff08;ICT&#xff09;十大趋势。这十大趋势是&#xff1a;1、5G时代起航&#xff0c;开辟数字化转型新空间2、信…

小括号教学设计导入_2020年小学教师资格证复习资料之小学课堂教学导入-教师吧...

本节内容为2020年下半年小学教师资格证考试科目二《教育教学知识与能力》小学课堂教学导入考点详解。【考点&#xff1a;小学课堂教学导入】一、课堂教学导入概述(一)教学导入的概念所谓教学导入,是指在上课之初,教师利用几分钟的时间,运用简洁的言语或行为,将学生的注意力吸引…

Ubuntu 16.04 安装 Matlab2016a

在参考之前网上的一些ubuntu安装Matlab教程后,笔者在自己的笔记本上也尝试安装最新的matlab2016a。但是装了不同的教程都会出现报错,启动画面停止,弹出错误提示: Matlab has encountered an internal problem and needs to be close 笔者完全按照下面的教程安装, linux(x…

RPU4+1视图(转)

41视图模型概况 Kruchten 提出了一个"41"视图模型&#xff0c;从5个不同的视角包括包括逻辑试图、进程视图、物理视图、开发视图、场景视图来描述软件体系结构。每一个视图只关心系统的一个侧面&#xff0c;5个试图结合在一起才能反映系统的软件体系结构的全部…

牛客网数据开发题库_牛客网SQL题库NO.32~40

不要问为什么没有31题&#xff0c;大概被牛客吞掉了吧&#xff0c;哈哈哈哈SQL 32【简单】将employees表的所有员工的last_name和first_name拼接起来作为Name&#xff0c;中间以一个空格区分CREATE TABLE employees ( emp_no int(11) NOT NULL, birth_date date NOT NULL, firs…

VR/AR行业发展至今,它的市场规模如何

来源&#xff1a;AR工业应用全球知名研究咨询公司 Markets and Markets 2017 发布了一份研究报告&#xff0c;报告称&#xff1a;AR 市场规模将从 2016 年的 23.9 亿美金增长到 2023 年的613.9 亿美金。报告显示&#xff0c;诸如医疗保健、零售以及电商这样的行业对 AR头显不断…