x光肺部分割数据集_吴恩达发布了大型X光数据集,斯坦福AI诊断部分超越人类 | AAAI 2019...

aca879f504e8d564f538d66ec6523e27.png
数栗子 发自 凹非寺
量子位 报道 | 公众号 QbitAI

b11670f0c20bc4a7440fc356b8063448.png

最近,吴恩达的斯坦福团队发布了一个叫做CheXpert大型数据集,论文中选了AAAI 2019

它包含了224,316张标注好的胸部X光片,以及放射科医师为每张胸片写的病理报告。

虽然,像从前NIH发布的ChestX-ray14数据集那样,CheXpert也是根据医师的报告,自动标注肺水肿、心脏肥大等各种病症的;

但团队说,新的数据集更适合做Benchmark,因为测试集上的标签,是经过 (持证上岗的) 放射科医师验证的标签。

b2ccac38ff8f29c532af4e6507034676.png

团队便是用这个数据集做Benchmark,举行了一场5种疾病的识别比赛。

数据集是怎样炼成的

这22万张胸片,都是2002年10月到2017年7月之间,斯坦福医院做过的X光检查,来自65,240个就诊的人类。

有哪些标签

每张胸片有14个标签要贴,其中12个,是表明患者是否存在心脏肥大 (Cardiomegaly) 、肺部病变 (Lung Lesion) 等12种疾病特征

2540bd813189493eb75e26603532a766.png

另外两个标签,一个是无发现 (No Finding) ,另一个是辅助器具 (Support Devices) 。

14个标签,都分为 (Negative) 、 (Positive) 以及不确定 (Uncertain) 这三种选项。

因为,并不是所有问题,都能从胸片上得到确定的答案。如果不能做出明确的判断,就不可以贸然输出阴或阳。

自动标注工具

有了14个标签要贴,吴恩达团队开发了一种自动贴标签的算法:从医师每张胸片做的报告文本里,找到和每个标签相对应的信息。

算法分三步:

一是提取文中提及的信息 (Mention Extraction) ,得出一个列表;
二是为提及的信息做分类 (Mention Classification) ,分成阴、阳、不确定这三类;
三是把提及的信息聚合起来 (Mention Aggregation) ,得出最终结论,标注完成。

团队已经把标注工具开源了:

stanfordmlgroup/chexpert-labeler​github.com
215d4b3aba85cc30c39aadb4216fb94a.png

人类医师验证一下

数据集要成为合格的Benchmark,测试集给的标准答案就要有说服力。

团队找到8位持证的放射科医师,让他们独立去标注500张胸片的测试集。然后,把5位医师给出的主流答案作为Ground Truth;至于,另外3位医师的答案,后面有其他用途。

这样一来,各路诊断模型都可以在一个相对有效的标准之下接受评估。

对比一下,从前的ChestX-Ray14数据集里,测试集是自动标注,并没有经过人类医师的鉴定。团队认为,CheXpert更加适合做Benchmark

你也来比赛吧

既然提供了新的Benchmark,就可以拿来比赛。

02e02cf675dc2ce98db6489876f64432.png

吴恩达老师发推宣布,一场疾病识别比赛已经开始了,欢迎大家带着自己的模型去参加。

比赛内容涉及5种疾病的识别:

· 肺不张 (Atelectasis)
· 心脏肥大 (Cardiomegaly)
· 肺实变 (Consolidation)
· 肺水肿 (Edema)
· 胸腔积液 (Pleural Effusion)

为了鼓励小伙伴们前去参与,团队祭出了自家模型里成绩最好的一只:

用500张胸片的测试集来比,这个模型在心脏肥大、肺水肿以及胸腔积液这三项上,超越了前面提到的“另外3位人类医师”

7a098223b9f4bc5372ac392124e082b0.png

若以粗暴的五局三胜为规则,AI已经赢了。

有兴趣的同学,可以去试试看自己的模型能不能超越斯坦福的AI。数据集和参赛方法都在这里啦:

CheXpert数据集传送门:https://stanfordmlgroup.github.io/competitions/chexpert/
(注册一下,就会收到下载链接)

CheXpert论文 (AAAI 2019) 传送门:https://arxiv.org/pdf/1901.07031.pdf

比赛参加方法传送门:https://worksheets.codalab.org/worksheets/0x693b0063ee504702b21f94ffb2d99c6d/

量子位 · QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态

戳右上角「+关注」获取最新资讯↗↗

如果喜欢,请分享or点赞吧~比心❤

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/574788.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python rpc webservice_关于RPC、HTTP、WebService的区别

关于 REST 介绍的文章已经很多了,这里只对 RPC 部分做一个介绍:RPC(远程过程调用)是什么简单的说,RPC就是从一台机器(客户端)上通过参数传递的方式调用另一台机器(服务器)上的一个函数或方法(可以统称为服务)并得到返回的结果。RPC 会隐藏底层…

python程序发布 ubuntu_将Windows项目发布到Ubuntu服务器详细教程(Windows编程,Ubuntu服务器做解释器)...

前期准备(1)专业版Pycharm(社区版没有deployment功能),学生,教师可申请免费专业版,详情可看我的博客。(2)可通过SSH连接Ubuntu服务器,并且服务器安装了Python解释器。部署本地Pycharm项目到Ubuntu服务器1.点击Tools - Deployment …

nios 双核 烧录_nios程序烧写到epcs方法

折腾了好久,才把nios程序烧写到epcs的方法弄明白。开始先在网上搜了下,这方面资料很多,看了半天也没怎么弄明白,无奈,只好去找官方文档,看完后,只想说,官方文档确实给力。下面列出参…

access百度翻译 get_Asp.NET调用百度翻译

Asp.NET调用百度翻译,图示:HTML:OA翻译TextMode"MultiLine">源语言:自动检测中文英文日文目标语言:自动检测中文英文日文runat"server" Text"翻译" οnclick"Translate_Click" />C…

angular js 默认选中_AngularJS Select(选择框)

下拉框默认的值为 key-value 对中的 value ,也可以用 as 来修改下拉框的值。也就是 x for (x, y) 相当于是 y as x for (x, y)。as 前面的为下拉框的值,后面的为下拉框显示的内容。​也可以不使用key-value 对中的 value 作为下拉框的值, 直接使用对象的…

【Qt之Quick模块】6. QML语法详解_1 基础语法与三种导入语句

前言 通过以上1-5文档的介绍,Quick与QML的概念及QML语法、类型、文件作用等已叙述个大概,接下来是对QML语法进行展开来说。 其实,学习任何一门语言或者做任何一件事情,并不用一开始就要求尽善尽美,做个无懈可击&…

datagrip将一个数据库中的数据_跨平台数据库管理神器DataGrip,用上就爱不释手...

原文链接:https://www.ffeeii.com/2041.htmlDataGrip是Jetbrains旗下众多优秀的效率生产工具之一。下载地址:https://www.jetbrains.com/datagrip/DataGrip是多引擎数据库环境,支持几乎常见的数据库类型:PostgreSQL、MySQL、Oracl…

栅格单元值的选取方法_ArcGIS中栅格数据重采样方法

2.用ArcGIS中的Resampling工具进行栅格重采样操作在ArcToolbox中依次找到Data Management Tools—>Raster—>RasterProcessing—>Resample工具,工具界面如下图所示:其中各参数含义如下:Input raster: 输入栅格数据集Output raster d…

城市轨道交通运营管理属于什么院系_专业介绍|城市轨道交通运营管理专业

原标题:专业介绍|城市轨道交通运营管理专业专业介绍丨城市轨道交通运营管理专业▲▲▲汽车工程系简介THE FIRST汽车工程系目前开设了汽车检测与维修技术、城市轨道交通运营管理、城市轨道交通通信信号技术等专业,在校学生700余人。汽车工程系突出复合型技…

idea 鼠标变量_IntelliJ IDEA鼠标悬停方法显示Java Doc

本问题已经有最佳答案,请猛点这里访问。我正在使用IntelliJ IDEA 9,是否可以配置IDEA,以便在将鼠标悬停在某个方法上时,IDEA会调出Javadoc(与CTRL Q相同)?看来,此功能可能最终会进入IntelliJ IDEA 12.1或1…

ad18敷铜为什么打的孔里面也有_PCB覆铜后放置大量过孔有什么作用?具体怎么放置?...

底层 顶层 共地下面摘抄的:过孔的多少不等同于决定某种实际的意义!大家都知道在高频情况下,印刷电路板上的布线的分布电容会起作用,当长度大于噪声频率相应波长的1/20 时,就会产生天线效应,噪声就会通过…

python程序写完后点哪个运行快_让 Python 代码运行更快的最佳方式!

PyPy与CPythonPyPy是Python解释器CPython的直接替代品。CPython将Python编译为中间字节码然后由虚拟机解释,而PyPy使用实时(JIT)编译将Python代码转换为本地机器的汇编语言。根据正在执行的任务,性能提升可能会非常显着。平均而言,PyPy将Pyth…

idea下拉项目_推荐几款非常好用的IDEA插件(香)

每天进步一点点,坚持下去,你总是会不一样的。加油!最近在整理Java常用的一些基础、ZooKeeper、Spring全家桶、源码、Dubbo、Elasticsearch、Redis、MySql、RabbitMQ、Kafka、Linux 、微服务等技术栈。持续更新中,欢迎点上面后端架…

python批处理代码_【原创源码】【python】python文本文件批处理

[Python] 纯文本查看 复制代码import osimport shutildef text_edit_vhd(filepath):with open(filepath,r) as file_head:content file_head.read()file_head.seek(0,0)file_head.write("protect begin \n" content)file_head.seek(0,2)file_head.write("\npr…

php 汉王云名片_汉王云-名片识别【最新版】_OCR_人工智能_API-云市场-阿里云

{"moduleinfo":{"advanList_count":[{"count_phone":4,"count":4}],"title":"云市场服务保障体系","mapList_count":[{"count_phone":4,"count":4}]},"advanList":[{&qu…

git 如何提取已提交的文件_git取两次提交的文件列表,包含目录信息

1.用git rev-list HEAD取得版本号列表:在SmartGit中看到的也是这样,验证了我们的猜想:取到两个版本号之后,用git diff命令:git diff [--options] ... [--] […​]这里的[-options]我们填的是--name-status,…

filco的pin码_一把强行帮你退烧的键盘 plum niz atom66静电容

一把强行帮你退烧的键盘 plum niz atom66静电容2019-09-10 10:37:578点赞17收藏14评论小编注:此篇文章来自即可瓜分10万金币,周边好礼达标就有,邀新任务奖励无上限,点击查看活动详情说起niz,正是个神奇的牌子,老板一个人就负责制作…

在fritzing中怎么导入_电路图制作软件(Fritzing)

Fritzing,图形化Arduino电路开发软件。Fritzing是个电子设计自动化软件。它支持设计师,艺术家,研究人员和爱好者参加从物理原型到进一步实际的产品。还支持用户记录其阿尔杜伊诺和其他电子为基础的原型,与他人分享,在教…

得力助手 消防员的 消防机器人_消防机器人市场如今的发展现状,是否能成为消防员的得力助手...

随着经济的不断发展,使消防和应急救援的要求越来越高。基础工业的快速发展也使得易燃、易爆和剧毒化学品引发火灾的可能性越来越高。一方面,今天的消防需要更详细的消防信息和更快的消防和救援速度。另一方面,在改革后的消防系统建立后&#…

自己配置python环境_windows下python环境的配置

1 安装python类似其他软件,点击下一步就行了注意选择把python.exe加入到path中,当然也可以自己手动配置验证python是否安装成功>>>后面输入代码,可以立即看到结果,c语言等利用{}来界定代码块,python利用缩进来…