来源:腾讯科技
据外媒报道,现在正有一场从硅谷延伸到底特律的竞赛正在进行,即谁能最先制造出比人类司机驾车更安全的无人驾驶汽车?
与几年前相比,这是一项更为艰巨的任务,因为人类司机了解更多东西,不仅仅关于他们的汽车,还包括人类在开车时的行为。为了达到与人类相同的理解水平,计算机化的汽车需要大量的数据支持。
目前,拥有最多数据的两家公司分别是特斯拉和Waymo。
特斯拉和Waymo都在试图收集和处理足够多的数据,以制造能够无人驾驶的汽车,但他们以截然不同的方式处理这些问题。
特斯拉正在利用它在道路上的数万辆汽车收集真实世界的数据,这些数据与其车辆如何使用自动驾驶仪(Autopilot)有关,这种司机驾驶辅助系统目前已经实现半自动化。Waymo最初只是谷歌的无人驾驶汽车项目,它使用强大的计算机模拟,并利用现实世界中规模小得多的测试车队推动进化。
无人驾驶汽车的支持者坚称,无人驾驶技术将会降低每年因车祸而死亡的人数,美国这个数字高达4万人。但是,将所有这些数据驱动的技术尽快应用到道路上,还可能带来巨大的经济效益。英特尔认为,无人驾驶汽车在2030年的收入将达到8000亿美元,到2050年将达到每年7万亿美元规模。
2017年夏天,摩根士丹利(Morgan Stanley)分析师亚当·乔纳斯(Adam Jonas)在报告中表示,数据对特斯拉来说可能比Model 3更有价值。他写道:“只有一个市场足够大,足以推动特斯拉的价值达到伊隆·马斯克(Elon Musk)的个人抱负水平,那就是里程、数据和内容。”
图1:特斯拉视频显示启动状态下的自动驾驶仪
特斯拉正通过使用客户拥有的汽车来收集所有重要数据,从而实现其车辆的无人驾驶。该公司拥有成千上万的客户,他们中的许多人每天都在世界各地的街道上使用自动驾驶仪。根据隐私政策规定,特斯拉可以收集有关该功能性能的信息。
对于任何一个关注马斯克旗下另一家公司SpaceX的人来说,这都是一个熟悉的策略。马斯克已经悄悄地在真正的火箭发射中测试设备,甚至还出售该公司的许多测试发射机会。
很难确定特斯拉已经从其自动驾驶仪中获得多少行驶里程的数据,因为该公司没有发表太多关于这方面的公开声明。2016年,当时的自动驾驶仪业务负责人在麻省理工学院(MIT)的会议上说,特斯拉已经记录了12.6亿公里里程的数据,其中有1.6亿公里的数据是在自动驾驶仪控制(或部分控制)下实现的。
在2016年夏末,马斯克称特斯拉每天收集的数据量“刚刚超过480万公里”。不过,截至去年7月份,特斯拉汽车的总行驶里程已增至80亿公里。随着特斯拉销售的汽车越来越多,其可以收集的数据量将呈指数增长。
当然,并不是所有里程都是在无人驾驶仪控制下完成的,自动驾驶仪目前只具备半自动化驾驶功能。但特斯拉也收集有关自动驾驶仪如何处理不同场景的数据,即使该功能没有被真正使用。
特斯拉汽车可以记录自动驾驶仪采取行动的情况,数据最终会被传送给特斯拉。这种所谓“阴影模式”(shadow mode)的收集意味着,特斯拉可以在数十亿公里的行驶中模拟完全自动驾驶情况下的数据。
另一家拥有类似数据量的公司是Waymo,该公司今年早些时候宣布,它已经模拟行驶了80亿公里的无人驾驶里程。Waymo还表示,其无人驾驶汽车在公共道路上行驶的距离也达到800万公里,这比几乎所有其他公司无人驾驶汽车路测里程的总和都要多。
Waymo受到的限制是,它只是通过大约500到600辆无人驾驶的Pacifica汽车车队收集真实世界的数据。而特斯拉在全球公路上拥有超过30万辆汽车在行驶,而且这些汽车所处的环境远比Waymo更多样化,Waymo目前仅在美国德克萨斯州、加州、密歇根州、亚利桑那州和佐治亚州进行测试。但特斯拉只能在现实世界里学习,因为即使是自动驾驶仪,当前版本也只是半自动化。
这种平衡也会发生改变。Waymo计划在今年年底前向其车队增加“数千辆”克莱斯勒汽车。最近,该公司还宣布与捷豹路虎公司合作,开发完全自动驾驶的全电动I-Pace SUV。Waymo表示,在未来几年,该公司将为其车队增加2万辆测试汽车。而且当所有这些汽车上路时,它将每天能够处理100万次汽车旅行。
但在那之前,Waymo在很大程度上依赖于模拟,但计算机并非总能想出所有奇怪的真实场景。这就是为什么现在特斯拉在现实世界中领先的原因,Ark Invest分析师塔莎·基尼(Tasha Keeney)说:“我觉得每个人都认为意Waymo的技术是目前最好的,但我认为很多人都低估了特斯拉数据集的力量。”
图2:数据类型
这两家公司不仅收集不同规模的数据,它们也收集不同的数据。Waymo的无人驾驶面包车使用三种不同类型的激光雷达传感器、5个雷达传感器和8个摄像头。特斯拉的汽车也配备了大量的装备,包括8个摄像头、12个超声波传感器,还有一个面向前方的雷达。
但是特斯拉没有使用激光雷达。激光雷达和雷达很像,但它不收发无线电波,而是每秒发出几百万个激光信号,并测量它们反弹的时间。这使得我们有可能创造出一幅分辨率非常高的汽车周围环境图像,如果它被放置在正确的位置(比如汽车顶部),甚至可以囊括所有方向。
即使在黑暗中,它也能保持这种精度,因为传感器本身就能提供光源。这一点很重要,因为在黑暗中,摄像头的性能通常更差,雷达和超声波也不那么精确。
激光雷达既昂贵又笨重,它还需要移动机械部件(至少现在是这样)。马斯克最近称该技术为“支柱”,并表示,虽然这短期内会让事情变得更容易,但该公司将不得不掌握基于摄像头的系统,以降低成本。
基尼表示,如果特斯拉能在没有这种技术的情况下开发出无人驾驶汽车,那将获得巨大优势。她解释说:“这是个风险更高的策略,但最终会给他们带来更大回报。如果特斯拉能取得成功,那么其他所有公司都只能自生自灭。”
但事实上,这种假设存在很大不确定性。卡内基梅隆大学旗下、有通用汽车公司资助的无人驾驶研究实验室主管拉吉·拉杰库马尔(Raj Rajkumar)说:“如果没有激光雷达数据,特斯拉可能会发现自己处于不利地位。”
许多业内人士认为,激光雷达是打造无人驾驶汽车的必备工具,拉杰库马尔表示,人们对特斯拉的做法持怀疑态度。他说:“我们认为,硬件不足以做到这一点,特斯拉在打造全自动无人驾驶汽车方面不太可能成功。”
目前还不清楚特斯拉开始收集什么样的数据。根据该公司的隐私政策,特斯拉可以获取有关汽车速度、加速、刹车、电池使用情况的数据,并能在事故中保存“短视频片段”。这些数据可以在远程或约定服务期间收集。但是对于自动驾驶仪,隐私政策只规定特斯拉可以访问“该功能关于使用和操作的信息”。
特斯拉拒绝评论从哪些传感器收集了数据,也未透露收集的数据量。特斯拉可以获得汽车上的所有视频,也可以收集某些特定时刻(比如碰撞)的摄像头视频,或者是没有视频的超声波传感器数据。
拉杰库马尔表示,现在尚不清楚特斯拉收集的是全帧速率的视频还是不太逼真的东西。基尼表示同意,她说:“Waymo的数据集更详细,因为他们使用的是激光雷达,它比你从摄像头中获得的信息多得多。”
处理挑战
收集数据是一回事。但就连马斯克也指出,处理数据同样是一项艰巨的任务。马斯克在去年夏天的财报电话会议上说:“处理这些数据,然后利用数据对自动驾驶仪进行培训,让车辆从数据中有效地学习,这实际上是个相当大的挑战,因为数据的数量过于庞大。”
相比之下,Waymo对它的模拟似乎更有信心。据《大西洋月刊》去年夏天发布的一份报告称,该公司重新设计了其正在测试的城市的全电脑模型,并每天通过它们测试2.5万辆“虚拟无人驾驶汽车”。
这有助于Waymo通过在计算机上重新创建真实的驾驶数据来创建一个紧密的反馈回路系统,在那里可以测试“数千种变化场景”。这些数据随后被下载到Waymo的测试车中。Waymo还在加州建立了一个专门的测试设施,它可以在那里建立特定的街道特征或场景,以便给它的汽车带来最大麻烦。
拉杰库马尔说,这个闭环回路系统“是以投入令人难以置信的投资、资源、时间和努力为代价的,当然Waymo有母公司的强力支持。”他说,特斯拉很难与之匹敌。特斯拉将不得不在这方面投入更多,并经历高度劳动密集型的过程。
在两年前发表的第二份特斯拉“总体规划”中,马斯克表示,无人驾驶技术要想真正获得“全球监管批准”,大约需要行驶96亿公里。特斯拉很可能已经在现实世界里通过了这个门槛,但它的汽车仍然不能完全自动驾驶。一辆特斯拉汽车计划在2017年以无人驾驶的方式从洛杉矶驶往纽约,但这场演示已被推迟,而特斯拉打造最终版自动驾驶仪的目标仍未实现。
与此同时,Waymo在模拟行驶里程方面也接近96亿公里,该公司的虚拟里程增长比以往任何时候都要快,还有数千辆测试车在等待参加测试。Waymo计划在今年晚些时候推出一款使用无人驾驶汽车的商业叫车服务项目,该项目已经在亚利桑那州试行,这将进一步支持其数据反馈回路。
图3:其他竞争者
特斯拉和Waymo是测试无人驾驶技术的两家领先公司,但他们并不孤单。在这个领域最明显的竞争者之一就是网约车巨头Uber。与特斯拉和Waymo相比,Uber采用了一种更随意的方式进行无人驾驶测试,这是该公司的典型特征,它体现了硅谷“快速行动、打破常规”的座右铭。
2016年在匹兹堡开始测试后,Uber又在旧金山街道上推出了早期版本的改良后半自动沃尔沃汽车,但没有获得该州许可。当测试为此受阻后,Uber将测试转移到亚利桑那州。Uber最终同意了加州的基本要求,但它与国会议员们的妥协,导致这家公司落后于像Waymo这样的竞争对手。
当Uber在三个州建立起测试车队后,它的无人驾驶行驶里程将急速增加。据《纽约时报》报道,到2017年11月,Uber的无人驾驶汽车已经在全美范围内行驶了320万公里。
目前还不清楚Uber的模拟无人行驶里程,其技术质量也受到质疑,因为其一辆测试车于3月份在亚利桑那州杀死了一名行人。Uber首席执行官达拉·科斯罗萨西(Dara Khosrowshahi)表示,该公司仍将“致力于”该项目,但其测试工作目前仍处于暂停状态。
基尼表示,在无人驾驶汽车方面,唯一可与Waymo或特斯拉在质量方面媲美的竞争者是一家老牌公司,即通用汽车公司。在被收购的子公司Cruise Automation帮助下,通用始终在开发无人驾驶版Bolt EV。该公司最近宣布,计划在2019年测试自己的有限商业无人驾驶服务。
图4:通用公司正在设计无方向盘或踏板的全电动Chevy Bolt,并将在2019年用其改装的Cruise Automation技术进行商业试验
通过生成和处理需要教汽车如何使用无人驾驶技术的数据,通用公司正追随Waymo的脚步。但基尼认为,通用公司的优势在于其生产规模。她说:“Waymo与捷豹达成了交易,这可能会在未来帮助他们取得重大进展,但他们实际上并没有在内部生产汽车。我认为,拥有垂直战略是有好处的。有了自主传感器,当你从头开始构建时,你就能更好地处理产品的外观,以及如何优化所有东西。”
与特斯拉的策略相似,通用公司也有半自动化的产品,目前已被应用在行驶路上的客户车中。但这种产品Super Cruise仅限于一款凯迪拉克(Cadillac)车型,而且没有迹象表明它会很快扩散到其他车型上。
在基尼看来,通用正错失大好良机。她说:“这就是他们所错失的机会,其他所有汽车制造商也都错过机会。为什么没有人把传感器放在客户车上,就像特斯拉那样收集数据?”
模拟战略
在这场无人驾驶汽车竞赛中,有一匹黑马值得关注,那就是英伟达。尽管英伟达的无人驾驶技术没有达到特斯拉和Waymo所夸耀的数十亿公里里程,但其技术正被无人驾驶领域的数百家公司(包括特斯拉在内)使用。上个月,英伟达开始销售其称为Drive Constellation的产品,它实际上是为其他公司的无人驾驶项目准备的一种模拟设备。
换句话说,这是英伟达已用于测试的模拟设备的商业版本,它已经在英伟达自己的无人驾驶软件和硬件中得到过验证。
英伟达公司汽车项目高级总监丹尼·夏皮罗(Danny Shapiro)在接受采访时表示,获得良好的模拟设备对开发无人驾驶汽车至关重要。他说:“我们不可能在真实路上驾驶,也无法预测发生在公路上所有疯狂的事情。最初,我们需要行驶数万亿公里的里程,其中绝大部分都非常无聊。但在某一时刻之后,你突然发现自己已经可以应付这种情况。”
这是工程师们必须研究的所谓“角落案例”,即不经常发生的情况。夏皮罗说,在开车时,会遇到很多这样的情况,比如闯红灯、路怒、危险天气、日出或日落时刺眼的阳光。在现实世界中,如果用测试车进行足够多的测试,你肯定会遇到这些事件和场景,但还不够频繁,因此也无法学会如何处理它们。
例如,在现实世界中,当太阳下山时,你每天只有几分钟的时间来在这种特殊时刻开车。而在模拟中,你可以24小时在日落场景中开车,还可以制造各种各样的潜在危险。
这就是为什么任何公司都要首先在模拟环境中测试无人驾驶的原因。不过,通过降低进入门槛,英伟达已经让那些没有像特斯拉和Waymo这样的车队规模或资金支持的公司更容易进入这一领域。更重要的是,英伟达作为无人驾驶技术供应商的商业模式若被广泛采用,可能有助于为无人驾驶模拟创造一个事实上的行业标准。
非营利研究机构兰德公司(RAND Corporation)的高级信息科学家尼迪·卡拉(Nidhi Kalra)说,为无人驾驶模拟制定标准可能是这项技术的一个重要步骤,因为目前很难评估私人公司所做模拟的质量。
他还称:“模拟器的问题在于,它是对现实世界的简化。即使它能准确地刺激世界,如果你所模拟的只是山景城中没有交通的、阳光明媚的一天,那么在山景城同样死气沉沉的路上模拟行驶10亿公里有什么价值呢?我并不是说任何人都在做这样的事情,但如果没有这些信息,我们不可能知道十亿公里里程真正意味着什么。”
卡拉为兰德公司撰写了一系列关于无人驾驶技术的研究报告,其中包括2016年的一项研究,试图确定在现实世界中需要行驶多少里程才能证明无人驾驶汽车比人类驾驶更安全。卡拉及其合著者苏珊·帕多克(Susan M. Paddock)得出的结论是,无人驾驶汽车需要“数亿公里,有时甚至是数千亿公里”,才能在统计学上证明其安全、可靠。因此,他们写道,公司需要找到其他方法来证明安全性和可靠性。
卡拉称,模拟可以达到这个目的,但无人驾驶汽车需要经历更多的环境。她说:“如果我告诉你,我在《侠盗猎车手》(Grand Theft Auto)中驾车行驶了10亿公里,但这并不能让我成为一个好司机。当有公司宣称:‘我们在模拟中行驶了无数公里’时,我想:‘好吧,我很高兴你有个模拟器。’”
卡拉表示,对于任何“模拟行驶里程”、宣称实现某个里程碑的公司来说,除非他们提供更详细的模拟数据,否则其技术都值得怀疑。卡拉解释称:“真实世界的行驶里程仍然非常非常重要。从字面上看,这就是橡胶与公路的交汇之处,没有什么可以替代它。”
图5:知道特斯拉和Waymo在模拟和现实世界中已经积累了最多的行驶里程,这有助于为讨论谁拥有“最多”数据,但这些知识本身不足以真正决定谁占据了最终优势
如果特斯拉确实能在没有激光雷达的情况下实现完全自动驾驶,那么理论上它可以将软件升级推给其客户,从而获得优势。
但特斯拉如何证明其技术是安全的呢?特斯拉确实有自己的小型试车车队,且在加州车辆管理局(DMV)注册,但它们在2017年的行驶里程却为零。该公司利用当前自动驾驶仪版本通过其客户车队已经积累了庞大的行驶里程,但大多数车辆收集的数据都与其自动驾驶仪在现实世界中的应用有关,在发生致命车祸后,其技术再次受到美国国家运输安全委员会的调查。
当拥有数万辆汽车组成的测试车队时,Waymo可能会更好地证明其技术的安全性,但这可能同样是困难的,因为它仍然局限于少数几个地点。即使在目前宽松的无人驾驶测试环境下,扩大这些努力的进展也需要时间。
另一个问题是如何定义“安全”。对所有这些公司来说,唯一通用的衡量标准就是所谓的“脱离”(disengagement),它跟踪安全驾驶员代替自动驾驶系统重新控制汽车的次数。这也是一个不完美的衡量标准,它只被加州DMV所收录,而且它被证明很容易捏造,因为它只有松散的定义。
当这些公司向监管机构或客户证明他们已经开发了完全自动驾驶技术时,最可能的指标就是判断该公司开发的无人驾驶汽车是否与人类司机驾车同样安全,或比人类司机更安全。至于如何定义每X公里的事故发生率、每X公里的受伤率甚至每X公里的死亡率,则是另一个问题。
正如卡拉和帕多克在他们的研究中所指出的那样,在现实世界中很难证明这一点。但是卡拉认为,单靠模拟无法证明这一点,至少在更全面、更开放的理解所收集数据的质量和速率前,不能匆忙下结论。她说:“我们可能会看到这项技术先被部署,然后才有确凿的证据证明它有多安全。这就是矛盾所在:在我们决定使用无人驾驶汽车之前,我们无法证明它有多安全。”
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”