作者:camel
概要:Jeff Dean发表了这篇博文的下篇,内容包括谷歌大脑在 AI 应用方面(诸如医疗、机器人、创新、公平和包容等)的工作。
昨天谷歌大脑(Google Brain)负责人 Jeff Dean 在 Google Research Blog 上发表了谷歌大脑团队 2017 年的回顾总结上篇,详述了谷歌大脑过去一年中在自动机器学习、语言理解和生成、新的机器学习算法和应用、隐私与安全、理解机器学习系统、开放数据集、TensorFlow、TPU 等一系列方面的研究工作。
今天Jeff Dean发表了这篇博文的下篇,内容包括谷歌大脑在 AI 应用方面(诸如医疗、机器人、创新、公平和包容等)的工作。下面我们把这篇总结文的下篇全文翻译如下:
谷歌大脑团队的工作目标是通过科学研究和系统工程不断推进顶级 AI 系统的发展,这也是整个谷歌的 AI 战略的一部分。在这篇博文的第一部分,我介绍了我们 2017 年在基础研究方面的工作,内容包括从设计新的机器学习算法和技术到理解它们,以及与社区共享数据,软件和硬件。
医疗
我们认为将机器学习技术应用于医疗保健领域具有巨大的潜力。他们在这个方面也做出许多工作,包括协助病理学家来检测癌症、理解医疗对话以协助医生和病人互动,以及利用机器学习解决基因组学中的各种问题,此外还开放了一个基于深度学习的高精度变型呼叫系统的源代码(https://github.com/google/deepvariant)。
淋巴结活检,我们的算法正确识别出肿瘤而不是良性巨噬细胞
据了解,在印度的眼科医生有 12.7 万名,但结果却是几乎有一半的上述疾病的患者都被诊断为晚期——疾病已经导致视力丧失。作为试点的一部分,我们在 Aravind 眼科医院推出了这个系统,用来帮助医院的工作人员更好地诊断糖尿病性眼部疾病。此外,我们还与合作伙伴合作,尝试了解影响糖尿病性眼部疾病护理方面的人为因素(包括患者和医疗保健者的民族志研究)以及眼科护理临床医师如何与 AI 支持系统进行交互的调查。
第一名病人(上);Iniya Paramasivam,一位训练有素的分级师,正在查看系统的输出(下)
机器人
谷歌大脑在机器人学上的长期目标是设计学习算法,使机器人能够在复杂的现实环境中进行运作,并能够通过学习来快速获得新的技能和能力,而不是像如今的机器人那样需要精心控制的条件或针对特定任务编写特定的程序。
除了现实世界机器人经验和模拟机器人环境外,我们还开发了机器人学习算法,可以通过观察人类对所需行为的演示来学习。我们认为这种模仿学习方法是一种非常有前途的方式,它能够非常快速地向机器人传递新的能力,这个过程没有明确的规划,甚至没有明确规定活动的目标。
推荐阅读:
Yann Lecun CoLR演讲:机器该如何像动物和人类一样有效学习
Anca Dragan CoRL 演讲:机器人与人类如何相互影响及更好协作?
基础科学
谷歌大脑认为机器学习在帮助解决科学中的重要问题上具有长期的潜力。去年我们利用神经网络在量子化学中预测了的分子性质(http://t.cn/R6epE6Q),在天文数据中寻找到了新的系外行星(http://t.cn/R6epE6Q),从地震数据中预测了地震的余震(https://arxiv.org/abs/1701.06972),并利用深度学习指导了自动化的证明系统。
信息通过神经网络预测有机分子的量子特性
寻找新的系外行星:当行星遮挡光线时,观察的恒星亮度。
创造力
谷歌大脑也对如何将机器学习作为工具来帮助人们进行创造性创作非常感兴趣。
今年,我们创作了一个 AI 钢琴二重奏工具(https://experiments.withgoogle.com/ai/ai-duet/view/),帮助了 YouTube 音乐人 Andrew Huang 创作新的音乐,并展示了如何教机器画画。
SketchRNN 模型绘制的花园; 互动演示(http://autodraw.com/)
我们还演示了如何控制运行在浏览器中的深度生成模型来创建新的音乐,这个作品在 NIPS 2017 上获得了最佳Demo奖,这也是大脑团队的 Magenta 项目成员连续第二年获得该奖项(NIPS 2016 上与 Magenta 互动音乐即兴演奏的 demo 获得了该年度的最佳Demo奖)。
在下面的视频中,您可以听到演示的一部分,这是 MusicVAE 变奏自动编码器模型从一个旋律到另一个旋律的平滑过渡。
class="video_iframe" data-vidtype="-1" data-ratio="1.7647058823529411" data-w="480" scrolling="no" data-src="http://v.qq.com/iframe/player.html?vid=q1331bcm08k&width=666&height=374.625&auto=0" style="display: none; width: 670px !important; height: 378.625px !important;" width="670" height="378.625" data-vh="374.625" data-vw="666" src="http://v.qq.com/iframe/player.html?vid=q1331bcm08k&width=666&height=374.625&auto=0"/>
People+AI Research(PAIR)倡议
机器学习的进步为人们如何与计算机进行交互提供了全新的可能性。同时,确保社会能够从我们构建的技术中获得广泛的好处,是至关重要的。我们认为这些机遇和挑战是一件紧迫的事情,因此通过与谷歌公司中的众多人员进行合作,我们提出了一份 People + AI Research(PAIR)倡议。
PAIR 的目标是研究和设计人与 AI 系统进行交互最有效的方法。为此,我们举办了一场公共研讨会,将来自计算机科学、设计甚至艺术等学科领域中的学术研究者和实践者聚集在一起共同讨论。PAIR 的工作范围非常广泛,其中一些如通过解释性工作帮助研究人员了解 ML 系统,并用 deeplearn.js 扩展开发人员社区。我们在以人为中心的 ML 工程方法方面的另外一个例子就是 Facets(https://pair-code.github.io/facets/)的推出,这是一种可视化和可理解的训练数据集工具。
Facets帮助你深入理解你的训练数据集
机器学习中的公平和包容
随着 ML 在技术上的作用越来越大,包容性和公平性的考虑也变得越来越重要。Brain 团队和 PAIR 在这些领域取得了一些进展。我们已经发表了在 ML 系统中如何通过因果推理来避免歧视(https://arxiv.org/pdf/1706.02744.pdf)、地理多样性在开放数据集中的重要性(https://arxiv.org/abs/1711.08536),并写了一个博文分析了一个公开数据集以了解多样性和文化差异(http://t.cn/RCRru3o)。我们也一直与 AI 合作伙伴进行密切的合作,PAIR 是一个跨行业的倡议,它旨在帮助我们确保让公平和包容成为所有 ML 从业者的共同目标。
正如在左边的这些涂鸦图案中所观察到的那样,文化差异可以在训练数据时(甚至在对象中)是“通用”的椅子。 右侧的图表显示了我们如何发现标准开源数据集(如ImageNet)中的地理位置偏差。 未被发现或未被纠正,这种偏见可能强烈影响模型行为。
我们与谷歌创意实验室的同事合作制作了下面这个视频,作为这个领域的一些非技术性介绍。
class="video_iframe" data-vidtype="-1" data-ratio="1.7647058823529411" data-w="480" scrolling="no" data-src="http://v.qq.com/iframe/player.html?vid=t1331wnzlvv&width=666&height=374.625&auto=0" style="display: none; width: 670px !important; height: 378.625px !important;" width="670" height="378.625" data-vh="374.625" data-vw="666" src="http://v.qq.com/iframe/player.html?vid=t1331wnzlvv&width=666&height=374.625&auto=0"/>
我们的文化
谷歌大脑的研究文化的一个方面是,让研究人员和工程师们去解决他们自己认为最重要的基础研究问题。
在 2017 年 9 月份,我们发布了开展研究的一般方法。教育和知道年轻的研究人员是我们研究的一部分。我们去年共接待了 100 多名实习生,在 2017 年中有约 25% 的发表文章有实习合作者参与。
在 2016 年,谷歌大脑开启了 Google Brain Residency 计划,该计划旨在指导哪些想学习机器学习研究的人。在首年(2016 年 6 月-2017 年 6 月)共有 27 位培训人员加入我们团队,在半年的时间里共发表了 23 篇论文(http://t.cn/RM48D31)。这些培训人员现在大部分都作为专职研究人员和研究工程师留在我们团队中。
2017 年 7 月,我们迎来了第二批 35 位培训人员,他们将会待到 2018 年 7 月,不过现在已经做出了许多令人兴奋的研究工作,并已经发表了很多一系列的论文(http://t.cn/RQGmmki)。
我们现在已经扩大了该计划的范围,将谷歌许多其他研究组包括在内,并将计划重新命名为 Google AI Residency program。(本年度计划的申请截止日期刚刚过去;请在 g.co/airesidency/apply 查看有关明年计划的信息)
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。由互联网进化论作者,计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”