【AI学习】地平线首席架构师苏箐关于自动驾驶的演讲

在地平线智驾科技畅想日上,地平线副总裁兼首席架构师苏箐(前华为智驾负责人)做了即兴演讲,以下是其演讲的主要内容:
对自动驾驶行业的看法
自动驾驶的难度与挑战:苏箐表示自动驾驶非常难,他做自动驾驶到现在已经快抑郁了,很多优秀的同学都改行了,去做具身智能机器人。他认为自动驾驶是第一个在物理世界跟人交互的机器人,是在一个半规则和半非规则的场景里面的东西,如果连自动驾驶都搞不定,去做完全是非结构化的机器人是不可能的。
自动驾驶的价值拐点:苏箐认为自动驾驶系统的竞争对手是人类本身,其价值是一个拐点式的价值。当自动驾驶比不过人的时候,它就是高科技的玩具;当有一天比人好的时候,其价值立刻就会跳上去。到目前为止,还没有一个系统真正达到了这个拐点。
对行业现状的批评:苏箐直言不讳地表示,他不太喜欢中国智能驾驶行业这几年的氛围。他认为智驾行业应该做一点正确的产品,解决一些正确的问题,而不是天天活在营销里面。
对特斯拉的评价
苏箐坦率地表示,如果抛开跟人类的比较,今天一定要让他找个对标对象,他还是会选特斯拉FSD。他认为特斯拉在技术方面有很多独到之处,甚至在某些地方有断代式的领先。他从特斯拉身上学到了很多新的思想和思路。
地平线的目标与技术路线
2025年的目标:苏箐透露,地平线今年的目标有两个,一个是用一段式的端到端把类人做上去,第二是把车辆紧急接管安全性至少要提升100倍。他们相信,只有解决了这些问题,才能打造出与众不同的产品。
技术路线的选择:地平线在自动驾驶系统的内核上采用了完全的端到端数据驱动方法。但在数据稀疏、难以快速收敛的情况下,也会制定相应的规则来确保系统的便利性和有效性。此外,地平线还推出了最新的智能驾驶解决方案HSD,这套方案能够应对各种复杂的交通场景,包括在狭窄城区道路掉头等难例场景。
对中国自动驾驶市场的理解
苏箐认为,中国自动驾驶面临特殊挑战,如基建随意性、外卖行为不守规矩等。因此,地平线选择了一条务实的道路,根据中国国情进行自主研发。他强调,一个真正有价值的自动驾驶系统,应该能够在用户感到疲劳或不安全时,提供可靠的驾驶辅助,让用户能够放心地将驾驶任务交给系统。

备注

转微博@高飞的文章,作为参考
#模型时代# 地平线首席架构师苏箐关于自动驾驶的“苦涩的教训”

昨天我参加了一下地平线智驾科技畅想日的活动,地平线副总裁兼首席架构师苏箐(前华为智驾负责人)首次在媒体面前公开露面,并做了一段即兴演讲。讲的时间不长,但非常诚恳深刻。

他说“谈到(完美的自动驾驶),十多年过去了,全世界最聪明的人投入了这么多资金,还是没有突破这个点,确实会感到有些绝望”;而谈到解决方案,又讲“我干了这么多年,对每年出现的新概念和时髦词已经完全没感觉了。因为像这样的复杂系统,既没有捷径,也不存在一蹴而就的方法。明天有个新模型,搞个新工具就能解决所有问题,这种想法是不现实的;所以,结论是:”复杂系统的正确打开方式是:你要有一个非常强大的工程团队,要建立一个非常稳固的系统。在此基础上,不断地在一个嘈杂的环境中,将新的方法持续集成进去,然后不断前进“。

他讲到结论的时候,我就突然想到了Rich Sutton在2019年3月发表的名篇《The Bitter Lesson》,这篇文章的核心论点可以概括为一个深刻而"苦涩"的历史教训:在AI研究历史上,基于通用方法(利用计算能力的搜索和学习)的方案,最终总是战胜基于人类知识和智慧的特定方法。这个模式在计算机视觉、围棋、语音识别、机器翻译等多个领域反复上演。

所以,Rich Sutton说,“科学家的专业知识和智慧似乎不如简单的暴力计算更有价值”。虽然苏箐的看法是,国内的现实情况让业界无法用存粹的暴力算力数据堆叠,但两者都提到了这个领域没有“灵丹妙药”。既然如此,苏这句“一个强大的工程团队敢于干一些苦活累活优化前进”,某种程度上,也是一种苦涩的教训吧。

文字是现场记录,未经本人确认,仅供参考(其实我认为地平线的算法实际上有非常重要的优势,几年前的芯片架构设计就考虑了Transformer,苏的观点就有一些自谦的成分在):


1、说到今天的感受,我是既乐观又困惑。自动驾驶确实非常难,我有很多优秀的朋友已经改行去做别的事情了。

自动驾驶不是什么新东西了。自动驾驶的整个发展应该是从2004年的DARPA Project开始,从那个时候我们就看到了自动驾驶的可能性。我自己开始做这个是在2012年、2013年左右。

有不少人问我要不要去做机器人,但我想,我们连自动驾驶都还没搞定,怎么去做机器人呢?其实自动驾驶应该是第一个在物理世界中与人交互的机器人,它存在于一个半规则化的环境中。如果连这个都搞不定,去做一个完全非结构化环境下的机器人是不可能的。

2、自动驾驶的真正比较对象不是竞争对手,不是国内的蔚小鹏、华为或其他公司,而是人类本身。

它的价值是一个拐点式的价值:在比不过人的时候,它就是一个高科技的玩具;只有在某一天比人好的时候,它才会形成一个质变式的价值。但可惜的是,到目前为止还没有一个系统真正达到了这个拐点。

3、十多年过去了,看着全世界最聪明的人投入了这么多资金,还是没有突破这个点,确实会感到有些绝望。但是在绝望中依然能看到希望,因为经过五到六代核心技术的演进,整个系统确实能看到曙光。

说到我们的优势和理念,其实很简单,我并不打算去跟任何人比较。我干了这么多年,对每年出现的新概念和时髦词已经完全没感觉了。因为像这样的复杂系统,既没有捷径,也不存在一蹴而就的方法。明天有个新模型,搞个新工具就能解决所有问题,这种想法是不现实的。

4、复杂系统的正确打开方式是:你要有一个非常强大的工程团队,要建立一个非常稳固的系统。在此基础上,不断地在一个嘈杂的环境中,将新的方法持续集成进去,然后不断前进。我觉得这是做大型工程的一个经验之谈。

"说到自动驾驶的竞争,坦白说如果今天让我选择一个竞争对手的话,我还是会选择特斯拉FSD。因为美国团队的整体素质和创新经验确实值得敬佩。我自己实践后发现,他们在技术上确实存在一些不足,但这只是暂时的。我们也从中学到了很多新的思想和思路,至少他们已经证明了一些技术路线是可持续的,甚至在某些部分有断代式的领先。

5、但是说到中国的自动驾驶要跟美国做一样的事情,这是不现实的。

首先,在目前状况下,中国不可能投入像特斯拉那样的算力,无论是从经济还是政策角度都不可能。其次,中国的基建和道路条件与美国有很大差异。更重要的是,中国还面临着电动车不遵守交通规则等特殊问题,这导致了大量需要处理的博弈问题,而这些是现在的深度学习还不能完全解决的。

6、所以我们选择了一条比较务实的道路。我们的系统采用完全端到端的深度学习方法,但在一些数据比较稀疏、比较难处理,或者因为混杂数据难以收敛的情况下,我们也会让有经验的工程师去做一些规则设计,就是采用两种技术并行的方式。这在目前来看是最有效的方案。

当然,在做市场营销时,我们可以讲得天花乱坠,但对于普通消费者来说很简单,他上车后能够感觉到这个系统是可靠的,这才是最重要的。我到现在最推崇的产品仍然是Steve Jobs时代的iPhone,它在所有细节上都做到了极致,没有明显的弱点。目前这一代产品还没有看到谁能达到那个高度。我希望在我们这个产品中,能专注于解决真正的问题,而不是一味追求营销效果。

7、如果要谈自动驾驶的价值演进,我觉得可以分为三个阶段:第一个阶段是高科技的玩具,仅仅是噱头;第二个阶段是在高速公路上好用,虽然在城市道路上还不太理想,但起码在高速上开车时不用那么累了,只需要让它自己行驶就可以。虽然这个价值还不够高,但已经有一定意义了。不过这里要注意中美的差异:美国人上下班基本都走高速,而中国不是,中国的城市交通问题更复杂,是一个网格化的问题。

8、自动驾驶系统的本质问题是:到底是系统依赖人,还是人依赖系统?如果你想让这个系统真正产生价值,就要考虑这样的场景:当人们加班很累,感觉自己开车不太安全的时候,能否完全信任这个系统来接管驾驶?这才是系统真正的价值所在,它超越了单纯的功能价值。这也是我们正在努力要做到的方向。

9、说到底,我认为有两个关键点:第一是类人性,不好意思我提到这个词。但类人性的目的不是为了模仿人类,因为人开车时本来就不是预防性驾驶。比如今天我们看到一个系统在处理车辆变道时,你会观察到它’在思考要不要变道’,然后才做出动作,这其实已经不太对了。如果你完全感觉不到这个车辆在你的预判之前就已经把动作做完了,这个系统才是真正做对了。这是我们追求的目标。

第二个是要提升整个车辆的紧急避险安全性。这件事情非常难,但随着自动驾驶技术的推进,我们也发现了一些新的方法和线索。只有这两件事情都做到位了,我相信我们的产品才能在市场上真正与众不同。

10、坦白说,这么多人辛苦了这么多年,如果只是去做一个用来营销的东西,这不是我们应该做的事情。我们应该去解决实际的问题,而不是天天活在营销中。我个人不太喜欢中国这几年的氛围,我觉得我们应该做一些真正有价值的产品,尽管这很难。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/68239.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

说一说mongodb组合索引的匹配规则

一、背景 有一张1000多万条记录的大表,需要做归档至历史表,出现了大量慢查询。 查询条件是 "classroomId": {$in: ["xxx", "xxx", ..... "xxx","xxx", "xxx" ] }耗时近5秒,且…

更新java

下载 Java 下载 |神谕 (oracle.com)

CSS3的aria-hidden学习

前言 aria-hidden 属性可用于隐藏非交互内容,使其在无障碍 API 中不可见。即当aria-hidden"true" 添加到一个元素会将该元素及其所有子元素从无障碍树中移除,这可以通过隐藏来改善辅助技术用户的体验: 纯装饰性内容,如…

【Java设计模式-5】装饰模式:给咖啡加点“佐料”

今天咱们要探索一下Java世界里的装饰模式(Decorator Pattern)。为了让这个过程更加生动易懂,咱们就以大家都熟悉的咖啡饮品来举例吧,想象一下,你就是那个咖啡大师,要给顾客调制出各种独特口味的咖啡哦&…

C++(5)

1.运算符重载 头文件 #ifndef MYSTRING_H #define MYSTRING_H#include <iostream> #include <cstring>using namespace std;class myString { private:char *str;//C风格字符串int size0; public:std::string s_str;//转换构造函数myString(const std::string &a…

K8S--配置存活、就绪和启动探针

目录 1 本人基础环境2 目的3 存活、就绪和启动探针介绍3.1 存活探针3.2 就绪探针3.3 启动探针 4 探针使用场景4.1 存活探针4.2 就绪探针4.3 启动探针 5 配置存活、就绪和启动探针5.1 定义存活探针5.2 定义一个存活态 HTTP 请求接口5.3 定义 TCP 的就绪探针、存活探测5.4 定义 g…

【HTML+CSS+JS+VUE】web前端教程-36-JavaScript简介

JavaScript介绍 JavaScript是一种轻量级的脚本语言&#xff0c;所谓脚本语言&#xff0c;指的是它不具备开发操作系统的能力&#xff0c;而是用来编写控制其他大型应用程序的“脚本” JavaScript是一种嵌入式语言&#xff0c;它本身提供的核心语法不算很多 为什么学习JavaScri…

LLM实现视频切片合成 前沿知识调研

1.相关产品 产品链接腾讯智影https://zenvideo.qq.com/可灵https://klingai.kuaishou.com/即梦https://jimeng.jianying.com/ai-tool/home/Runwayhttps://aitools.dedao.cn/ai/runwayml-com/Descripthttps://www.descript.com/?utm_sourceai-bot.cn/Opus Cliphttps://www.opu…

AI多模态论文解读:LLaVA-CoT:让视觉语言模型逐步推理

本文作者&#xff1a;AIGCmagic社区 猫先生 一、简 介 LLaVA-CoT引入了四个不同的阶段&#xff08;摘要、标题、推理和结论&#xff09;&#xff0c;使模型能够独立进行系统化的多阶段推理&#xff0c;显著提高了在推理密集型任务上的准确性。 编译了LLaVA-CoT-100k数据集&am…

分布式缓存redis

分布式缓存redis 1 redis单机&#xff08;单节点&#xff09;部署缺点 &#xff08;1&#xff09;数据丢失问题&#xff1a;redis是内存存储&#xff0c;服务重启可能会丢失数据 &#xff08;2&#xff09;并发能力问题&#xff1a;redis单节点&#xff08;单机&#xff09;部…

《C++11》nullptr介绍:从NULL说起

在C11之前&#xff0c;我们通常使用NULL来表示空指针。然而&#xff0c;NULL在C中有一些问题和限制&#xff0c;这就是C11引入nullptr的原因。本文将详细介绍nullptr的定义、用法和优点。 1. NULL的问题 在C中&#xff0c;NULL实际上是一个整数0&#xff0c;而不是一个真正的…

供应链数字化转型参考大型供应链系统技术架构设计方案

该文介绍了一个大型供应链系统技术架构的设计方案&#xff0c;包括整体设计、核心技术目录和应用案例。设计采用Choerodon微服务框架&#xff0c;关注海量并发、可伸缩性、安全性等方面。同时&#xff0c;方案符合大型企业结构的HR组织架构&#xff0c;支持多级组织架构和角色、…

STM32F1学习——DMA直接存储器存取

一、DMA直接存储器存取 DMA的全称是 Direct Memory Access 直接存储器存取&#xff0c;他可以提供外设和存储器间或存储器和存储器间的高速数据传输&#xff0c;无需CPU的干预。 STM32有12个DMA通道&#xff0c;由DMA1(7个通道组成)和DMA2(5个通道组成)&#xff0c;STM32F103C8…

一个使用 Golang 编写的新一代网络爬虫框架,支持JS动态内容爬取

大家好&#xff0c;今天给大家分享一个由ProjectDiscovery组织开发的开源“下一代爬虫框架”Katana&#xff0c;旨在提供高效、灵活且功能丰富的网络爬取体验&#xff0c;适用于各种自动化管道和数据收集任务。 项目介绍 Katana 是 ProjectDiscovery 精心打造的命令行界面&…

6.2 MySQL时间和日期函数

以前我们就用过now()函数来获得系统时间&#xff0c;用datediff()函数来计算日期相差的天数。我们在计算工龄的时候&#xff0c;让两个日期相减。那么其中的这个now函数返回的就是当前的系统日期和时间。 1. 获取系统时间函数 now()函数&#xff0c;返回的这个日期和时间的格…

用 Python 处理 CSV 和 Excel 文件

&#x1f496; 欢迎来到我的博客&#xff01; 非常高兴能在这里与您相遇。在这里&#xff0c;您不仅能获得有趣的技术分享&#xff0c;还能感受到轻松愉快的氛围。无论您是编程新手&#xff0c;还是资深开发者&#xff0c;都能在这里找到属于您的知识宝藏&#xff0c;学习和成长…

vulnhub靶场【IA系列】之Tornado

前言 靶机&#xff1a;IA-Tornado&#xff0c;IP地址为192.168.10.11 攻击&#xff1a;kali&#xff0c;IP地址为192.168.10.2 都采用虚拟机&#xff0c;网卡为桥接模式 本文所用靶场、kali镜像以及相关工具&#xff0c;我放置在网盘中&#xff0c;可以复制后面链接查看 htt…

[云讷科技] 用于软件验证的仿真环境

我们使用Pursuit自动驾驶仪为各种场景设计仿真环境&#xff0c;以便用户可以在模拟环境中直接验证他们的软件&#xff0c;无需现场测试。该环境基于Gazebo引擎。 1. 工作区目录 模拟环境的工作区位于提供的U盘中的~/pursuit_space/sitl_space_pursuit中。用户可以按照用户手册…

【Uniapp-Vue3】页面生命周期onLoad和onReady

一、onLoad函数 onLoad在页面载入时触发&#xff0c;多用于页面跳转时进行参数传递。 我们在跳转的时候传递参数name和age: 接受参数&#xff1a; import {onLoad} from "dcloudio/uni-app"; onLoad((e)>{...}) 二、onReady函数 页面生命周期函数中的onReady其…

iOS 解决两个tableView.嵌套滚动手势冲突

我们有这样一个场景&#xff0c;就是页面上有一个大的tableView&#xff0c; 每一个cell都是和屏幕一样高的&#xff0c;然后cell中还有一个可以 tableView&#xff0c;比如直播间的情形&#xff0c;这个时候如果我们拖动 cell里面的tableView滚动的话&#xff0c;如果滚动到内…