来源:杨立昆《科学之路:人,机器与未来》
编辑:蒲蒲
人工智能(AI)近年来的发展可以说包罗万象,几乎涵盖了所有与机器智能化相关的内容。无论是机器人、冰箱、汽车还是软件应用,只要你想让它们变得像人一样聪明,这都属于人工智能的研究与应用范畴。而在日常生活中,AI 几乎充斥着我们触手可及的每个角落。
人们常常将人工智能、机器学习与深度学习交错使用以代指普遍意义上 AI,但这三者之间其实是“包含于”的关系:深度学习包含于机器学习包含于人工智能。
由于深度学习的先进性,在本文的语境中,当我们在论述人工智能的时候,我们更多的是在探讨深度学习技术在人工智能领域的应用与落地。
深度学习在不断开拓未来AI应用边界的同时,也并没有完全掩盖传统AI的光芒:树型探索、寻找最短路径、逻辑推理......许多自20世纪60年代以来已知的方法,如今由于科技在不断进步,已经获得了非凡的效率,在自动驾驶、虚拟助手、医学影像与医学等领域大放异彩。
图灵奖得主、Facebook 人工智能首席科学家杨立昆(YannLeCun)在他的新书《科学之路:人,机器与未来》具体阐述了人工智能革命的起始极其对人类社会产生的影响。
由于潜在市场的规模,人工智能的4个主要应用类别吸引了大型工业集团的兴趣,它们是医药、自动驾驶汽车、虚拟助手以及家用和工业机器人。但也有许多研究人员认为,只有取得重大概念的突破,这些应用才能得到进一步推广。
这里重大的概念突破指的是:这些智能机器人只有在学习了规划复杂动作的世界模型,只有能够像动物和人类一样有效地学习,只有积累起足够的世界知识以产生某些常识,变革才会成为可能。
01
AI+自动驾驶,创造出行新场景
虽然已经取得了不俗的成绩,但我们还是要注意:尽管汽车的辅助驾驶系统在2019年得到了极大的发展,但全自主模型仍在实验当中,大多数时候仍需要有人坐在副驾驶进行监视。
在高峰时间没有人为干预的情况下,在纽约、巴黎、罗马或加尔各答的街道上实现全自动驾驶的汽车,如果不依靠自我监督学习和预测模型,也许根本是不可能的。我们可能需要先弄清楚人类自身是如何在短短20个小时内学会驾驶的。
我认为自动驾驶系统将经历三个阶段:第一个阶段,系统的很大一部分功能由人工编程,深度学习仅被用于感知;第二个阶段,深度学习的重要性逐步提升,并占据重要地位;第三个阶段,机器具备足够的常识,驾驶技术比人类更可靠。
一家名叫 MobilEye 的以色列公司推出的系统是第一批市场的辅助驾驶功能系统之一,后来该公司被英特尔收购。2015年,MobilEye 为埃隆·马斯克的电动汽车公司特斯拉提供了基于卷积网络的、几乎全自动的高速公路驾驶视觉系统,将这个系统配备在了特斯拉 Model—S2015年的车型上。
自2014年以来,字母表公司(Alphabet,谷歌的母公司)的子公司Waymo 一直在旧金山进行自动驾驶汽车实验。公司的董事会成员皆是谷歌员工。2018年,亚利桑那州开始向所有人开放自动驾驶出租车。这个地方确实很适合开展此项目:道路宽阔、人流量少、气候宜人。Waymo 采用了混合系统,配备了一系列复杂的传感器(雷达、激光雷达和照相机),以及基于卷积网络的视觉识别和规划的传统方法,人工编程的驾驶规则,精确显示限速标志、人行横道、交通信号灯的详细地图……这些技术的结合使汽车能够精准定位自己、识别移动的物体并发现不可预见的事件,例如道路施工。当汽车驶入十字路口并且有优先通过权时,它可以做出正确的反应。但仍需要有人坐在副驾驶(这个座位不再被称为“死亡之座”)上进行监督,确保这一切的安全开行。
激光雷达可以绘制详细的关于汽车周围环境的三维地图。它会生成一个360度的图像,在每个方向上都给出在该精确轴线上与最接近物体的距离。这样,障碍物检测系统的工作就容易多了。但是,高性能的激光雷达设备十分昂贵、脆弱、难以维护并且对天气条件敏感。它们可以被用来装备一个出租车队,却无法被安装到所有人的汽车上。
当条件良好时,自动驾驶汽车是比较可靠的,我们可以通过一组数据说明这一点:2014—2018年,加利福尼亚州仅发生了59起自动驾驶撞车事故(当地要求自动驾驶汽车制造商报告道路上发生的事故,包括轻微事故)。
当然,我们需要区分半自动驾驶和自动驾驶。在半自动驾驶的过程中,驾驶员虽然不做任何事情,但他实际上在持续地监督系统;而自动驾驶是指系统可以在没有驾驶员监督的情况下驾驶汽车。
无须人工操作的自动驾驶纪元将会始于行驶在安静郊区的、挂满传感器的车队。而私家车在巴黎、罗马或孟买的街头实现自动驾驶之前,相关技术仍需慢慢地进步。
02
AI+虚拟助手
2013年由斯派克·琼兹(Spike Jonze)执导的科幻电影《她》(Her)描述了一个男人与他的虚拟助手之间可能的互动,男主角泰奥爱上了这个拥有斯嘉丽·约翰逊(Scarlett Johansson)的声音、名为萨曼莎的计算机实体。这是少有的以逼真方式处理人工智能的电影之一。其场景皆属于未来派,但心理层面是合乎逻辑的。人类倾向于依附物体、动物和周围的人。
但我们仍需面对现实,真正的机器人仍停留在科幻小说中。在理想情况下,虚拟助手能被赋予接近于人类的智力,并具有良好的常识,可以在日常生活中帮助我们,人们便无须花费大量时间处理电话、电子邮件或在互联网上解决行政问题、联系手机服务、安排日程或过滤消息。一个聪明的助手应该能回答任何问题,在专业会议中给我们提供帮助,提醒我们上次会面的结论,但至少到现在为止,这一切都是不可能的。
每个虚拟助手的内部都结合了多个应用程序。听到“亚历克萨(Alexa)”,黑色的圆形智能音箱就会亮起。一个节能小程序使与之连接的扬声器始终保持待机状态,并且仅会检测唤醒它的单词。只有这样,我们才能与虚拟助手交流。在它的麦克风后面,接收到的声音信号被数字化。
Alexa 具有远程语音识别系统。转换成数字信号的语音将被传输到亚马逊的服务器,服务器将识别单词,将单词转录为文本。要想识别不同种类的语言,需要使用不同的、经过相应语言环境训练的神经网络。
需要澄清一点,与虚拟助手连接的扬声器是否会监视房屋内的生活?
是,也不是!
说是,是因为虚拟助手处于“连续收听”模式,以便检测到唤醒它的单词“Alexa”“OK Google”(谷歌的语音助手)或“Hey Portal”(脸书的语音助手)等,只有这些单词才能使它将某些内容传输到中央服务器。而一旦记录了一个句子,它就会将其发送到服务器,进而可能会识别并产生答复。如果虚拟助手在被“唤醒”后记录了家庭暴力现场的尖叫声,那么服务器将不执行任何操作。针对这一点,从技术的角度上看,服务器其实是可以有所行动的,但从伦理的角度上看,它不可能采取任何行动。对于极为重视声誉的公司,例如亚马逊、谷歌或脸书,我们是可以放心的。但是,如果这是一个由隐蔽在某处、身份不明的极客编写的黑客程序,那就必须要当心了。
03
AI+生物医学与医学影像
深度学习应用最广泛的科学领域就是是生物医学,例如研究蛋白质折叠——这些由氨基酸组成的大分子是构成所有生物细胞的基础,它们是由基因合成的,DNA(脱氧核糖核酸)中的字母序列被转化为形成蛋白质的氨基酸序列。
而蛋白质会折叠成特定的形状,这样就能够与其他蛋白质相互作用并执行功能,例如使肌肉收缩......它们折叠的形状决定了它们的功能。为了找到新的药物或新的治疗方法来阻止两种蛋白质黏附在一起,或者相反的再促进它们结合在一起,我们必须能够找到那些支配蛋白质折叠的生化机制,例如Deep Mind公司的Alpha Fold系统。
在医学影像领域,深度学习技术过滤了那些可以被轻易判断的就诊案例,从而降低了诊断成本,提升了诊断的效率。而这一技术支柱便是杨立昆博士的主要研究成果——卷积网络的应用。
卷积网络通常用于X光片、磁共振成像、CT(电子计算机断层扫描)检查,也用于肿瘤、风湿病或关节置换的检测。
对于传统的X光片,例如有两个图像的乳房X光片,由于我们在两个轴上都进行X光照射,因此经过训练的卷积网络会观察图像中每一个细小的区域,当它观察到可疑的像素点时就会做出反应。这是使用卷积网络进行语义分割的直接应用。
为了对此类系统进行训练,需要收集大量由放射科医生绘制出肿瘤轮廓的大量乳房X光片。这些照片会被分成一定大小的窗口,从而产生数百个小图像。将图像逐一输入一个卷积网络中,并告知网络窗口中心是否存在肿瘤。由此,它便学会了根据肿瘤的存在与否对窗口进行分类。
当投入实际应用时,卷积网络会遍历整个X光片,并将每个窗口的中心像素标记为“有肿瘤”或“没有肿瘤”。它在该过程结束时会生成一种图像,将肿瘤染色并给出检测的可信度。
如果没有检测到任何东西,那么答案很简单:“没问题”。大多数乳房X射线照片就是这种情况。如有任何可疑之处,X光照片就会被发送给放射科医生,以进行更加细致的研究。
卷积网络过滤器过滤了那些可以被轻易判断的案例,从而降低了诊断成本,提升了诊断的效率。专业人员也因此有了更多的时间,可以专注应对那些较难判断的案例,这样就减少了因工作量过大而导致的劳累和注意力不集中的风险。要知道,放射科医生要在暗室里的屏幕前工作很长时间,而他们所检查的大多数都是正常图片。
04
AI+Everything
除了自动驾驶、虚拟助手和医学影像之外,深度学习在许多其他科学领域中也发挥着举足轻重的作用,括天体物理学(星系的分类和系外行星的发现)、粒子物理学[分析日内瓦CERN(欧洲核子研究组织)粒子加速器上碰撞产生的粒子射流]、材料科学(具有新特性的超材料的设计)、社会科学(对社会互动的大规模分析)、神经科学(了解大脑中的感知机制)......
不难想象,在不远的将来,“AI+一切”将不止是一个过过嘴瘾的噱头,而是真真切切、正在进行中的现实。人工智能时代,你需要的不是担忧和焦虑,而是成为更好的学习者,抓住每一分资源和机会,让自己成为更有价值的人。
本文摘编自中信出版集团8月新书《科学之路:人,机器与未来》
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”