IBM Watson失败的4大原因

640?wx_fmt=jpeg

来源：大数医达

被称为“认知计算”革命性代表的IBM Watson从诞生那一刻起，就一直在被质疑中发展，在发展中被质疑。近日，坊间传言IBM Watson健康部门将裁员50%-70%，甚至也有传言说，整个健康部门将被关闭，所有员工要么辞职要么转岗。IBM Watson是失败的案例，这已经是业界普遍结论。问题是，为什么IBM Watson一度被业界仰望，又为了什么，曾经的神，那么快就失败?

失败原因之一：

过分夸大的市场宣传

自从IBM Watson面市，对外的市场宣传，有两个重点。1. IBM Watson超越人类医生，2. 能够解决连人类医生都挠头的疑难杂症。这样的宣传，在短时间内，迅速拉高了外界对于IBM Watson的期望。IBM Watson的宣传策略，拉升了公众对自己产品乃至整个医疗AI产品的期望值，获得了外界大量的关注。但是，在业界还缺乏统一的测试标准，产品最终的临床效果还有待评价的情况下，过分夸大的市场宣传，对产品长期健康的发展并没有好处。然而，高调到失真的宣传，成为IBM Watson日后失败的罪魁祸首。

主攻肿瘤等疑难杂症的Watson?

IBM Watson对外宣传自己从海量的医学文献和病历中提取医生临床诊断经验，通过机器学习让计算机掌握临床诊断方法，可以替代人类医生看很多疑难杂症，例如肿瘤。这个目标为IBM 研发团队挖了一个巨大的坑。疑难杂症的病历数量必然就很少，诊断成功的案例就更为罕见。训练数据不足，IBM Watson如何用机器学习的方法，获得精准的结果?

Watson的诊断精度比人类医生更高?

IBM Watson宣称在东京大学附属医院等试点项目中，IBM Watson的诊断已经比人类医生中最顶级的专家的会诊更加精准。机器学习，能学习到人类医生的经验，已经让人喜出望外。想让机器通过学习人类，，然后超越人类，不是不可能，但是前提条件是，必须能让机器反复试错。临床医学，试错的代价是人类生命，这和下围棋可不一样，不是能够容忍反复试错的场景。

失败原因之二：

技术水平远远不能支撑超越人类医生的目标

理论研究指导产品实践，产品实践推动理论研究。在IBM Watson研究组发表的相关论文中，没有发表过有关机器阅读的成熟的研究成果，其实直至今日，机器阅读仍然处于低幼阶段。而IBM 的宣传声称，IBM Watson 能够在10分钟内，阅读2000万篇癌症研究论文，并且把人类自然语言，翻译成机器可以处理的形式语言(formal language)，然后与病人的基因变化进行对比。

当IBM Watson课题研究的前沿课题，都还没有远远不能完成真正的阅读作为在市场上出售的产品级别的IBM Watson，怎么可能高速读解人类论文，并且基于阅读理解，做进一步操作，譬如对比呢?

失败原因之三：

产品开发与研究及市场严重脱节

IBM Watson在产品开发阶段，不但与市场宣传脱节，同时也与前沿技术研究脱节。事实上，IBM内部真正参与产品开发的人员，数量并不充裕，使用的真实病历数量也不多。病历数量最多的单病种是肺癌，而肺癌的病历数量也不过只有635例，其它疾病更是少得可怜。

食材少，厨师少，巧妇难为无米之炊，从何谈起超越人类医生呢?

失败原因之四：

整体规划混乱战线太长

2015年8月份，IBM 花费 10 亿美金，收购医疗图像公司 Merge Healthcare。但是似乎在IBM Watson并没有在医疗图像识别领域，取得抢眼的成就，更没有在产品中，把文字解析与图像识别，深度融合。忍不住想问，IBM的投资并购与产品研发，有没有预先规划好整合路径?

IBM Watson不可磨灭的功绩：从“演绎法”到“归纳法”

医疗人工智能演变的前世今生

以CDSS(Clinical Decision Support System)临床决策辅助系统为例，最早是在1970年前后，美国匹兹堡大学的研究人员开始从事这一领域的研究，当时研究人员使用的主要方法是从医学教科书和医学文献里提取医学规则，规则被表达成 “if-then”的形式逻辑。输入患者的症状，找到相应的if，然后根据then，推断罹患的疾病。

两年以后，1972年，斯坦福大学的教授也开始进行类似的研究，这个研究课题名叫MYCIN。MYCIN也主要是 if-then规则库，但是后来if-then规则库有了一个响亮的新名号，叫“专家系统Expert System”。

If-then规则，非黑即白，泾渭分明。后来把概率引入进规则，又用网状结构，把众多规则关联在一起，这就是1990年代大红大紫的技术，贝叶斯网络，又称因果关系网络。贝叶斯网络的旗手是Judea Pearl教授。2011年，他获得图灵奖。另一位研究“贝叶斯”网络的大咖是斯坦福大学的一位女教授，叫Daphne Koller。“贝叶斯”网络在数学上很美，但是落到实际应用过程中非常的复杂，始终找不到好的应用落地，于是贝叶斯网络热了一阵以后，现在门可罗雀。去年召开的一场国际计算机领域学术会议上， Pearl教授的演讲，听众寥寥。而Koller教授更为大家熟悉的成就，是与吴恩达合办的网校Coursera。

直到2011年，IBM Watson出现了。最开始的时候，IBM Watson是IBM研究院的一个研究课题，课题组从2006年开始，研究自然语言处理。他们教机器，从文献摘录出 “葡萄牙人，瓦斯科·达·伽马，于1498年5月20日到达卡利卡特” 这样的语句。又从其它文献中，摘录出 “卡利卡特位于印度西南部”这样的语句。然后串联这两句语句，推理出这样的结论，“葡萄牙人，于1498年登陆印度” 。这个课题组最著名的成就，是2011年参加了美国知识问答电视竞赛，Jeopardy，并战胜了人类选手。

这场比赛非常重要，它事实上宣告了AI人工智能应用时代的到来，是人工智能史上重大的里程碑事件。但是，这个事件本身只是一场电视节目问答游戏。游戏成功以后，IBM公司积极致力于把科技成果转化为赢利产品，进过一番分析比较，IBM选择了医疗。

IBM Watson

医疗人工智能领域的探路者

事实上，IBM选择医疗方向进行转化是对的，医疗服务市场空间非常巨大。从海量病历中，挖掘整理人类医生的临床诊疗经验，这个方法论是归纳法。而先前从医学文献中提取规则的方法，是演绎法。IBM Watson改变了人工智能医疗所使用的方法论。

近代科学的历史说明，方法论的改变很可能带来翻天覆地的变化。在Francis Bacon 以前，主流的方法论是演绎法。从圣经古兰经这些真理的源泉，推理出生活中细节规律。Francis Bacon 倡导归纳法，在他的影响下，出现了人们开始重视归纳法，随即出世牛顿这样的科学家，然后科学家源源不断地大量涌现。

因此，IBM Watson从海量病历中提炼临床诊断经验，而不是从医学文献中摘抄并推理医学规则，这是方法论的变革。IBM Watson引领认知革命，这句赞誉，并不过分。

目前很多人把谷歌公司的Google Medical Brain项目，视为人工智能医疗的业界领袖。Google Medical Brain项目也是从海量的病历中，挖掘整理人类医生的临床路径。并且于今年4月份在Nature杂志上发表了一篇论文，系统地描绘了Google Brain整个项目规划。方法论一致，但是细节更精致。虽然IBM Watson由于上述四个方面的原因，现在落后了，但是IBM的历史功绩是必须得到承认的。因为IBM改变了方法论，思路决定高度!

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能，互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）云脑研究计划，构建互联网（城市）云脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。

如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg