图灵奖得主杨立昆：AI+时代，未来将会如何被改变

来源：杨立昆《科学之路：人，机器与未来》

编辑：蒲蒲

人工智能（AI）近年来的发展可以说包罗万象，几乎涵盖了所有与机器智能化相关的内容。无论是机器人、冰箱、汽车还是软件应用，只要你想让它们变得像人一样聪明，这都属于人工智能的研究与应用范畴。而在日常生活中，AI 几乎充斥着我们触手可及的每个角落。

人们常常将人工智能、机器学习与深度学习交错使用以代指普遍意义上 AI，但这三者之间其实是“包含于”的关系：深度学习包含于机器学习包含于人工智能。

由于深度学习的先进性，在本文的语境中，当我们在论述人工智能的时候，我们更多的是在探讨深度学习技术在人工智能领域的应用与落地。

深度学习在不断开拓未来AI应用边界的同时，也并没有完全掩盖传统AI的光芒：树型探索、寻找最短路径、逻辑推理......许多自20世纪60年代以来已知的方法，如今由于科技在不断进步，已经获得了非凡的效率，在自动驾驶、虚拟助手、医学影像与医学等领域大放异彩。

图灵奖得主、Facebook 人工智能首席科学家杨立昆（YannLeCun）在他的新书《科学之路：人，机器与未来》具体阐述了人工智能革命的起始极其对人类社会产生的影响。

由于潜在市场的规模，人工智能的4个主要应用类别吸引了大型工业集团的兴趣，它们是医药、自动驾驶汽车、虚拟助手以及家用和工业机器人。但也有许多研究人员认为，只有取得重大概念的突破，这些应用才能得到进一步推广。

这里重大的概念突破指的是：这些智能机器人只有在学习了规划复杂动作的世界模型，只有能够像动物和人类一样有效地学习，只有积累起足够的世界知识以产生某些常识，变革才会成为可能。

AI+自动驾驶，创造出行新场景

虽然已经取得了不俗的成绩，但我们还是要注意：尽管汽车的辅助驾驶系统在2019年得到了极大的发展，但全自主模型仍在实验当中，大多数时候仍需要有人坐在副驾驶进行监视。

在高峰时间没有人为干预的情况下，在纽约、巴黎、罗马或加尔各答的街道上实现全自动驾驶的汽车，如果不依靠自我监督学习和预测模型，也许根本是不可能的。我们可能需要先弄清楚人类自身是如何在短短20个小时内学会驾驶的。

我认为自动驾驶系统将经历三个阶段：第一个阶段，系统的很大一部分功能由人工编程，深度学习仅被用于感知；第二个阶段，深度学习的重要性逐步提升，并占据重要地位；第三个阶段，机器具备足够的常识，驾驶技术比人类更可靠。

一家名叫 MobilEye 的以色列公司推出的系统是第一批市场的辅助驾驶功能系统之一，后来该公司被英特尔收购。2015年，MobilEye 为埃隆·马斯克的电动汽车公司特斯拉提供了基于卷积网络的、几乎全自动的高速公路驾驶视觉系统，将这个系统配备在了特斯拉 Model—S2015年的车型上。

自2014年以来，字母表公司（Alphabet，谷歌的母公司）的子公司Waymo 一直在旧金山进行自动驾驶汽车实验。公司的董事会成员皆是谷歌员工。2018年，亚利桑那州开始向所有人开放自动驾驶出租车。这个地方确实很适合开展此项目：道路宽阔、人流量少、气候宜人。Waymo 采用了混合系统，配备了一系列复杂的传感器（雷达、激光雷达和照相机），以及基于卷积网络的视觉识别和规划的传统方法，人工编程的驾驶规则，精确显示限速标志、人行横道、交通信号灯的详细地图……这些技术的结合使汽车能够精准定位自己、识别移动的物体并发现不可预见的事件，例如道路施工。当汽车驶入十字路口并且有优先通过权时，它可以做出正确的反应。但仍需要有人坐在副驾驶（这个座位不再被称为“死亡之座”）上进行监督，确保这一切的安全开行。

激光雷达可以绘制详细的关于汽车周围环境的三维地图。它会生成一个360度的图像，在每个方向上都给出在该精确轴线上与最接近物体的距离。这样，障碍物检测系统的工作就容易多了。但是，高性能的激光雷达设备十分昂贵、脆弱、难以维护并且对天气条件敏感。它们可以被用来装备一个出租车队，却无法被安装到所有人的汽车上。

当条件良好时，自动驾驶汽车是比较可靠的，我们可以通过一组数据说明这一点：2014—2018年，加利福尼亚州仅发生了59起自动驾驶撞车事故（当地要求自动驾驶汽车制造商报告道路上发生的事故，包括轻微事故）。

当然，我们需要区分半自动驾驶和自动驾驶。在半自动驾驶的过程中，驾驶员虽然不做任何事情，但他实际上在持续地监督系统；而自动驾驶是指系统可以在没有驾驶员监督的情况下驾驶汽车。

无须人工操作的自动驾驶纪元将会始于行驶在安静郊区的、挂满传感器的车队。而私家车在巴黎、罗马或孟买的街头实现自动驾驶之前，相关技术仍需慢慢地进步。

AI+虚拟助手

2013年由斯派克·琼兹（Spike Jonze）执导的科幻电影《她》（Her）描述了一个男人与他的虚拟助手之间可能的互动，男主角泰奥爱上了这个拥有斯嘉丽·约翰逊（Scarlett Johansson）的声音、名为萨曼莎的计算机实体。这是少有的以逼真方式处理人工智能的电影之一。其场景皆属于未来派，但心理层面是合乎逻辑的。人类倾向于依附物体、动物和周围的人。

但我们仍需面对现实，真正的机器人仍停留在科幻小说中。在理想情况下，虚拟助手能被赋予接近于人类的智力，并具有良好的常识，可以在日常生活中帮助我们，人们便无须花费大量时间处理电话、电子邮件或在互联网上解决行政问题、联系手机服务、安排日程或过滤消息。一个聪明的助手应该能回答任何问题，在专业会议中给我们提供帮助，提醒我们上次会面的结论，但至少到现在为止，这一切都是不可能的。

每个虚拟助手的内部都结合了多个应用程序。听到“亚历克萨（Alexa）”，黑色的圆形智能音箱就会亮起。一个节能小程序使与之连接的扬声器始终保持待机状态，并且仅会检测唤醒它的单词。只有这样，我们才能与虚拟助手交流。在它的麦克风后面，接收到的声音信号被数字化。

Alexa 具有远程语音识别系统。转换成数字信号的语音将被传输到亚马逊的服务器，服务器将识别单词，将单词转录为文本。要想识别不同种类的语言，需要使用不同的、经过相应语言环境训练的神经网络。

需要澄清一点，与虚拟助手连接的扬声器是否会监视房屋内的生活？

是，也不是！

说是，是因为虚拟助手处于“连续收听”模式，以便检测到唤醒它的单词“Alexa”“OK Google”（谷歌的语音助手）或“Hey Portal”（脸书的语音助手）等，只有这些单词才能使它将某些内容传输到中央服务器。而一旦记录了一个句子，它就会将其发送到服务器，进而可能会识别并产生答复。如果虚拟助手在被“唤醒”后记录了家庭暴力现场的尖叫声，那么服务器将不执行任何操作。针对这一点，从技术的角度上看，服务器其实是可以有所行动的，但从伦理的角度上看，它不可能采取任何行动。对于极为重视声誉的公司，例如亚马逊、谷歌或脸书，我们是可以放心的。但是，如果这是一个由隐蔽在某处、身份不明的极客编写的黑客程序，那就必须要当心了。

AI+生物医学与医学影像

深度学习应用最广泛的科学领域就是是生物医学，例如研究蛋白质折叠——这些由氨基酸组成的大分子是构成所有生物细胞的基础，它们是由基因合成的，DNA（脱氧核糖核酸）中的字母序列被转化为形成蛋白质的氨基酸序列。

而蛋白质会折叠成特定的形状，这样就能够与其他蛋白质相互作用并执行功能，例如使肌肉收缩......它们折叠的形状决定了它们的功能。为了找到新的药物或新的治疗方法来阻止两种蛋白质黏附在一起，或者相反的再促进它们结合在一起，我们必须能够找到那些支配蛋白质折叠的生化机制，例如Deep Mind公司的Alpha Fold系统。

在医学影像领域，深度学习技术过滤了那些可以被轻易判断的就诊案例，从而降低了诊断成本，提升了诊断的效率。而这一技术支柱便是杨立昆博士的主要研究成果——卷积网络的应用。

卷积网络通常用于X光片、磁共振成像、CT（电子计算机断层扫描）检查，也用于肿瘤、风湿病或关节置换的检测。

对于传统的X光片，例如有两个图像的乳房X光片，由于我们在两个轴上都进行X光照射，因此经过训练的卷积网络会观察图像中每一个细小的区域，当它观察到可疑的像素点时就会做出反应。这是使用卷积网络进行语义分割的直接应用。

为了对此类系统进行训练，需要收集大量由放射科医生绘制出肿瘤轮廓的大量乳房X光片。这些照片会被分成一定大小的窗口，从而产生数百个小图像。将图像逐一输入一个卷积网络中，并告知网络窗口中心是否存在肿瘤。由此，它便学会了根据肿瘤的存在与否对窗口进行分类。

当投入实际应用时，卷积网络会遍历整个X光片，并将每个窗口的中心像素标记为“有肿瘤”或“没有肿瘤”。它在该过程结束时会生成一种图像，将肿瘤染色并给出检测的可信度。

如果没有检测到任何东西，那么答案很简单：“没问题”。大多数乳房X射线照片就是这种情况。如有任何可疑之处，X光照片就会被发送给放射科医生，以进行更加细致的研究。

卷积网络过滤器过滤了那些可以被轻易判断的案例，从而降低了诊断成本，提升了诊断的效率。专业人员也因此有了更多的时间，可以专注应对那些较难判断的案例，这样就减少了因工作量过大而导致的劳累和注意力不集中的风险。要知道，放射科医生要在暗室里的屏幕前工作很长时间，而他们所检查的大多数都是正常图片。

AI+Everything

除了自动驾驶、虚拟助手和医学影像之外，深度学习在许多其他科学领域中也发挥着举足轻重的作用，括天体物理学（星系的分类和系外行星的发现）、粒子物理学[分析日内瓦CERN（欧洲核子研究组织）粒子加速器上碰撞产生的粒子射流]、材料科学（具有新特性的超材料的设计）、社会科学（对社会互动的大规模分析）、神经科学（了解大脑中的感知机制）......

不难想象，在不远的将来，“AI+一切”将不止是一个过过嘴瘾的噱头，而是真真切切、正在进行中的现实。人工智能时代，你需要的不是担忧和焦虑，而是成为更好的学习者，抓住每一分资源和机会，让自己成为更有价值的人。

本文摘编自中信出版集团8月新书《科学之路：人，机器与未来》

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）大脑研究计划，构建互联网（城市）大脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”