观五官知罕见病,AI“望诊”靠谱吗

640?wx_fmt=jpeg

新型人脸识别软件可助力罕见病诊断

来源:中国科学报


将人工智能(AI)用于医疗辅助诊断早已经不是什么新鲜事,仅AI医学影像辅助诊疗一项就有非常多的应用场景。然而,近日来自美国波士顿一家名为FDNA的数字医疗公司的研究人员大开脑洞,提出用深度学习技术仅仅通过“看面相”,就能帮助医生识别罕见基因疾病,并付诸实践。他们的研究于1月7日登上了《自然—医学》杂志,引起业内关注。


中医讲究“望闻问切”,其中望即有“望五官知五脏”“望痰辨病”等含义。如果AI能“学会”这本领,相信很容易获得人们青睐。不过,深度学习是一项比较“吃”数据的技术,而罕见病恰恰是临床医学上数据贫乏的领域。FDNA公司研究人员试图依靠AI望五官辨识基因异常引发的罕见病,行得通吗?


猜测准确率达65%


发表在《自然—医学》上的这篇文章提出了一种深度学习算法Deep Gestalt,它通过一款名为Face2Gene的App在智能终端发挥作用。据论文介绍,该App依靠深度学习算法和类脑神经网络来区分人类照片中与先天性和神经发育障碍有关的独特面部特征,然后利用从照片中推断出的模式,定位出可能的诊断结果,并提供可能的综合征遗传病选项。


在实验开始之前,FDNA公司首席技术官Yaron Gurovich带领研究者们首先训练人工智能系统来区分“Cornelia de Lange综合征”和“Angelman综合征”,这两种疾病患者都有区别于其他疾病的明显面部特征;同时,研究人员还训练该模型对“Noonan综合征”的不同基因形式进行分类。接下来,研究者们给该算法模型输入了涵盖216种不同综合征的 17000多张确诊病例的图像。


论文显示,在对502 张不同图像上的新面孔进行测试时,Face2Gene的最佳诊断猜测准确率达到65%。如果考虑多个预测结果,则Face2Gene 的top10准确率可以达到约90%。


这个结果显然有其一定的医学意义。FDNA 首席医疗官、该论文的共同作者之一Karen Gripp使用该算法帮助诊断了一名4岁女童的Wiedemann Steiner 综合征——这是由一种叫作 KMT2A 的基因变异引起的罕见疾病。Gripp 在研读了相关病例报告之后得知,该疾病会导致儿童牙齿过早生长。


由于年龄较小,这名小患者除了掉落大部分乳牙并长出多个恒牙,很多典型的躯体症状尚未显现。Gripp将该女童的照片上传至Face2Gene后,软件上出现了“Wiedemann Steiner 综合征”;接着,Gripp 用靶向DNA 测试进一步确诊了这一结果。


虽然Gripp最终依靠的是DNA检测进行确诊,但这名医生认为,该AI 方法可以帮助医生缩小病症范围,节约了昂贵的多基因检测费用。


目前,Face2Gene这款App处于开放下载状态,全世界的医疗专家都可以免费使用它。当然,这也是FDNA公司想要获取更多数据的策略,它需要更多数据来训练模型,使Face2Gene能够驾轻就熟地帮助医生辨别患者可能的基因遗传病。


Yaron Gurovich介绍,现在该项目的数据库中已有大约15万张照片。而随着更多医疗专家将病人的照片上传到该App,该项目的准确率也得到略微提升。


质疑:结论并不令人信服


并非没有质疑。在记者的采访中,长年致力于罕见病治疗研究的中科院生物物理研究所研究员刘光慧告诉《中国科学报》,罕见病种类太多,AI难以达到100%识别。


“一般的罕见病都有特殊面容,比如儿童早衰症及成人早衰症患者,面容都很特殊,通过AI识别有一定道理,这是一个很好的方向。”刘光慧转而说道,“但也有很多罕见病没有特殊面容或面容特征不明显,那么AI可能还不能做到100%识别。”


言外之意,如果在上述4岁女童案例中,换一种面容特征不那么明显的罕见病来测试,Face2Gene则可能会失灵;而如果Face2Gene一开始就判断错了,那么最终到底能不能省下多基因检测费,则又另当别论了。


更重要的是,该论文中的结论并不十分令人信服。


“502个图的测试集,分了200个类,top10 的准确率达到90%——假设数据平均,每个类仅两张图片可测试,这样的结果我不认为能得到‘识别遗传病准确率91%’的结论。”有质疑者认为,该论文结论稍显草率。


更有专业人士指出,该结论有“过拟合”之嫌,在实测中不一定可以达到这样的准确率。通常,在一些统计中,为了得到一致假设而使假设变得过度严格,就会出现“过拟合”,而要避免过拟合的发生,通常需要使用增大数据量和测试样本集的方法对分类样本进行评价。


对此,中科院自动化所研究员、生物识别与安全技术研究中心主任李子青(注:该文引用了李子青团队的一篇深度学习研究论文)对《中国科学报》记者谈了他的看法。他指出,这篇文章提供了三个实验结果:其中两个实验是从已确诊综合征的人脸图像中,识别出一种特定的综合征;另一个是区分Noonan综合征的两个子类型。可喜的是,三个都超过了门诊专家的准确性。但这篇文章所解决的问题,是从已确诊的人脸图像进一步分类或区分子型;从深度学习和模式识别角度来看,都不算难。


李子青认为,真正有挑战的是综合征筛查,即从普通人群发现有综合征的人,并对大规模人群诊断达到一定的准确度。这个问题更加有临床诊断意义,并且技术上比该文所处理的问题的难度要大很多。


对于深度学习算法而言,李子青认为“只要有数据,总可以训练出一个东西”,而至于效果如何,首先是取决于算法——在合理算法基础上,就是拼数据和计算资源。至于如何判断实效?则要看其推广性及泛化性。他表示认同记者的这一观点:罕见病病例少,数据难获取,模型的推广性不容易保证,这种方法的大众普查中应用还不成熟。


技术风险仍存


一般而言,只有训练数据集够好,算法才足够好用。从这个评价尺度上,Face2Gene的技术存在风险。对此,牛津大学计算生物学家Christoffer Nellker很是认同。他认为,尤其是涉及到那些全球患者人数极少的罕见疾病时,数据集的封闭化、商业化“会威胁到这项技术的主要潜在优势”。


此外,训练数据过于集中导致的种族偏见(大部分为白人)也是一大问题。2017年的一份儿童智力障碍研究表明,Face2Gene 对唐氏综合征的识别率在比利时白人小孩中为80%,而在刚果黑人小孩中仅为37%。对此,Yaron Gurovich意识到“这个问题需要解决”,但他也认为随着训练数据集变得更加多样化,算法对非洲面孔的识别准确率会随之提升,“偏见会越来越少”。


除了数据量的问题外,数据维度也非常重要。汇医慧影创始人兼CEO柴象飞在接受《中国科学报》记者采访时说,有时更多维度的数据比简单更大的数据更能帮助算法模型更精准地预测结果。


不过,科大讯飞智慧医疗事业部总经理陶晓东向《中国科学报》提出了类似算法在临床上常被忽略掉的另一个技术风险,“这一波人工智能过度依赖于数据,忽略了很多数据之外的信息”。


“深度学习解决问题的基本思路,到目前为止还都没有什么太大的突破。”陶晓东对记者说,在医疗领域里尤其如此,“你不可能像ImageNet那样获得几百万、上千万的训练数据”。因此,最基础的医学理论,应该被考虑在内。


“连基本的解剖信息都没有用在深度学习的框架里。”陶晓东说,这是值得目前如火如荼的“AI+医疗”深思的。


柴象飞对此也表示赞同,他对记者说,一些基于经验或常识的推理对于模型更精准地接近真相也非常重要,这或许对于数据样本偏少的罕见病模型意义更大。

 

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/492874.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

持续集成:CruiseControl.NET + VisualSVN.Server

刚换了工作,有需要搭建一套持续集成的平台,做一下总结。 首先是我用到的工具: 上面缺少了Microsoft Fxcop,可以用来做代码校验,不过实际情况暂时还没有用到。主要的需求目前是,使用已发布的稳定版本代码作为…

学会动态丨中国人工智能学会重磅发布《2018人工智能产业创新评估白皮书》

来源:中国人工智能学会摘要:《2018人工智能产业创新评估白皮书》由中国人工智能学会、国家工信安全中心、华夏幸福产业研究院、思保环球联合发布。白皮书聚焦人工智能的使能技术与应用场景两个层面,基于论文、专利、人才、行业壁垒等多个维度…

图像的几种变换简单介绍

刚体变换 平移旋转 保持欧式距离的变换,这意味着图像只进行2D平移和2D旋转运动。它只有3个自由度。 相似变换 平移旋转缩放 相比刚体变换增加了均匀的缩放。均匀的意思是各个方向的缩放比例相同。尺度变换增加了一个自由度,所以自由度为4。和刚体一…

《C语言编写 学生成绩管理系统》

/* (程序头部凝视開始) * 程序的版权和版本号声明部分 * Copyright (c) 2011, 烟台大学计算机学院学生 * All rights reserved. * 文件名: 学生成绩管理系统 * 作 者: 刘江波 * 完毕日期: 2012 年 6 月 23 日 * 版 本 号: v.62…

人工智能顶刊TPAMI2019最新《多模态机器学习综述》

来源:专知摘要:”当研究问题或数据集包括多个这样的模态时,其特征在于多模态。【导读】人工智能领域最顶级国际期刊IEEE Transactions on Pattern Analysis and Machine Intelligence(IEEE TPAMI,影响因子为 9.455),2019年1月最新…

编程基本功训练:流程图画法及练习

对于“程序设计”的工作,很多刚開始学习的人的理解就是“写代码”。相同,新手们苦恼的问题是,他们仅仅会“写代码”。当接到一个新的任务,不少人总是在第一时间就爬到键盘上去敲代码。敲着敲着,就把自己绕糊涂了。头晕…

python简单练习 -统计文本词频并用柱状图显示

函数功能:统计文本中单词频率,并用柱状图显示前10个最高的单词 这里统计的是函数所在文件本身 import turtlecount 10 data [] words [] # y yScale 6 # X xScale 30def drawLine(t, x1, y1, x2, y2):t.penup()t.goto(x1, y1)t.pendown()t.goto(x…

今日《科学》封面:纳米级清晰度看大脑是怎样一种体验?

来源:药明康德微信团队摘要:在最新出版的《科学》杂志上,由麻省理工学院(MIT)和霍华德休斯医学研究所(HHMI)的科学家们领衔的一支团队,成功对果蝇的完整大脑进行了成像,清…

中国演绎太空生命传奇

来源:人民日报海外版摘要:人类不仅在努力增加对地球家园的认识,而且推进航天科技发展,进入浩渺的太空,探索宇宙的奥秘。在太空中绽放的花朵嫦娥四号搭载的微型生物圈载荷手绘图搭载探空火箭进入太空的两只小狗“小豹”…

李伯虎院士:新一代人工智能引领下的智造制造初步实践

来源:电能革命由中国智能制造百人会主办的“2018智造百强榜高峰会暨2019中国智能制造百人会年会上”于2019年1月11日在北京科技会堂举行。中国工程院院士/国家制造强国战略咨询委员会委员李伯虎做“新一代人工智能引领下的智造制造初步实践”的演讲。以下为演讲的速…

Python中Turtle绘图函数-绘制时钟程序

Turtle常用的一些函数, 参考博客:http://blog.csdn.net/zengxiantao1994/article/details/76588580 时钟代码设计 我们可以通过main函数查看整个时钟代码的设计设计指针(Init())并显示指针:设计指针的方向(turtle.m…

5G的未来投资机会在哪里?

来源:网易智能日前,为了更好地以资本助推5G产业发展,中国移动投资公司与中国移动研究院联合发布了《洞见5G,投资未来——中国5G产业发展与投资报告》,分析了5G对生产和生活带来的变革,研判5G产业建设的投资…

python在windows系统中安装pandas,numpy

进入python的安装目录的sripts文件夹下, 在该文件夹下进入命令行,在命令行输入pip install pandas 等待成功安装 转载自:https://www.cnblogs.com/xuqiulin/p/6623154.html

华为5G首席科学家童文 | 5G:万物连接平台 智能世界基石

华为5G首席科学家、华为Fellow童文博士来源:华为2019年是5G产业进入全面商用的关键一年,全球5G网络的部署已经启动。2018年6月,5G独立组网标准冻结,5G完成了第一阶段全功能eMBB标准化工作;12月6日, 中国三大运营商获得…

深度解密:软银孙正义如何成为美国硅谷最有权势之人

来源:腾讯科技摘要:据外媒报道,伊隆马斯克、杰夫贝索斯亦或是马克扎克伯格(,都不如日本亿万富翁孙正义那样,对AI驱动的未来有着最大胆的愿景。在孙正义看来,未来机器将控制着我们的生活方式。为了实现这个愿…

自动驾驶之路已走了多远?一文读懂研究现状

作者:Claudine Badue等编译:机器之心 Panda摘要:自动驾驶载具或将引爆人类的下一次出行方式革命,而我们目前又已经走到了哪一步?近日,巴西圣埃斯皮里图联邦大学的研究者在 arXiv 上发布了一篇自动驾驶汽车研…

真的超越了波士顿动力!深度强化学习打造的 ANYmal 登上 Science 子刊

编译:机器之心深度强化学习开发出的机器人模型通常很难应用到真实环境中,因此机器人开发中鲜少使用该技术。然而这已经板上钉钉了吗?在两天前引发人工智能界关注的 ANYmal 机器人中,其机动性和适应性看起来丝毫不逊色于波士顿动力…

实例化Model的三种方式

转载于:https://www.cnblogs.com/toward-the-sun/p/4030010.html

人形机器人,穷途末路还是光明未来?

来源:任赜宇的知乎专栏摘要:今年 11 月初在北京召开的 IEEE/RAS Humanoids 会议中,作者去听了这样一个 Workshop: Humanoid Robotics: Dead-end or Bright Future? (人形机器人,末路还是光明的未来?) 再结合当前的形势…

全球自动驾驶政策概况及特征研究

来源:《中国信息通信研究院CAICT》近年来,美、欧、日等发达国家和地区将自动驾驶技术作为交通未来发展的重要方向,在技术研发、道路测试、标准法规、政策等方面为自动驾驶及其载体——智能网联汽车的发展提供政策支持,加快自动驾驶…