自动驾驶核心技术:感知融合、规划决策、控制执行

1、前言

        简单来说,实现自动驾驶需要解决三个核心问题:“我在哪?我要去哪?我该如何去?”能完整解决这三个问题就是真正的自动驾驶。

        目前,自动驾驶汽车关键技术主要包括环境感知、精准定位、决策与规划、控制与执行、高精地图与车联网V2X以及自动驾驶汽车测试与验证技术等。自动驾驶汽车可通过传感器来感知周围环境,实时动态监测周边环境变化,并依据所获取的信息进行决策判断,形成安全合理的路径规划。在规划好路径之后,汽车执行系统会控制车辆沿着规划好的路径完成驾驶。这套自动驾驶核心技术体系可简单概括为“感知、决策与执行”

        

  • 感知系统:被称为“中层控制系统”,负责感知周围的环境,并进行环境信息与车内信息的采集与处理,主要涉及道路边界监测、车辆检测、行人检测等技术。起着类似人类驾驶员“眼睛”、“耳朵”的作用,
  •         决策系统:被称为“上层控制系统”,负责路径规划和导航,通过执行相应控制策略,代替人类做出驾驶决策。相当于驾驶员的大脑。
  •         执行系统:也被称为“底层控制系统”,负责汽车的加速、刹车和转向,主要由电子制动、电子驱动以及电子转向三部分构成。相当于驾驶员的手脚。

        通过“感知、决策与执行”三个系统的分工协作,责任明确地控制汽车运行,可以令自动驾驶汽车具备理论上“自动行驶”的条件。

2、感知

        为了确保自动驾驶车辆在不同场景下均可以做出正确判断,需要实现对周围环境信息的实时动态获取和识别,这些信息包括但不限于自车的状态、交通流信息、道路状况、交通标志等,以满足车辆决策系统的需求。环境感知起着类似人类驾驶员“眼睛”、“耳朵”的作用,是实现自动驾驶的前提条件

2.1 Camera

        摄像机可以识别车辆行驶环境中的车辆、行人、车道线、路标、交通标志、交通信号灯等,具有较高的图像稳定性、抗干扰能力和传输能力。摄像机的优点是可以分辨颜色,比较适用于场景解读。

        但是camera也有其缺点:

  •         首先摄像机缺乏“深度”这一维度,没有立体视觉,无法判断物体和相机间的距离;
  •         其次,摄像机对光线较为敏感,过暗或过强的光线以及二者之间的快速切变都会对其成像造成严重影响。

        根据镜头和布置方式的不同,摄像机可大致分为四种:单目摄像机、双目摄像机、三目摄像机和环视摄像机。

  •         单目摄像机:主要用于路况判断,测距范围与距离需要互相取舍。
  •         双目摄像机:相近的两个摄像机拍摄物体时,会得到物体像素偏移量,根据相机焦距和两个摄像机的距离等信息,得到较高精度的测距结果和提供图像分割的能力。双目测距原理对两个镜头的安装位置和距离要求较多。
  •         三目摄像机:三个不同焦距单目摄像机组合。较好解决了感知范围与感知精度的问题。
  •         环视摄像机:环视摄像机的镜头是鱼眼镜头,而且安装位置是朝向地面。优点是视野广阔,缺点就是图像畸变严重。主要用于车身5-10米内障碍物检测、自主泊车的库位线识别等。

2.2 Lidar

        Lidar是发射激光束来探测目标空间位置的主动测量设备。主要有两个功能:3D的环境感知与SLAM加强定位。激光雷达以10Hz左右的速度对周围环境进行旋转扫描,其扫描一次的结果为密集的点构成的3维图,每个点具备(x,y,z)信息,这个图被称为点云图(Point Cloud Graph),如下图所示:

        为了理解点云信息,通常来说,我们对点云数据进行两步操作:分割(Segmentation)和分类(Classification)。其中,分割是为了将点云图中离散的点聚类成若干个整体,而分类则是区分出这些整体属于哪一个类别(比如说行人,车辆以及障碍物)。        

        目前,激光雷达已经发展了三代产品,包括第一代机械扫描激光雷达、第二代混合固态激光雷达以及第三代纯固态激光雷达。

2.3 Radar

        毫米波雷达是指工作在毫米波波段,频率在30—300GHz之间的雷达。毫米波雷优点:

  •         可以解决摄像机测距、测速不够精确的问题;
  •         可以处理激光雷达处理不了的沙尘天气。

        毫米波雷达缺点是:

  •         数据稳定性较差,对后续的软件算法提出了更高的要求。
  •         对金属极为敏感,路面的金属广告牌在很多场景下会被认为是障碍物,导致刹车不断。
  •         只能提供距离和角度信息,不能像激光雷达那样提供高度信息。

        根据测量原理的不同,可分为脉冲方式毫米波雷达和调频连续波方式毫米波雷达两种。

  •         脉冲方式毫米波雷达:原理与激光雷达相似,硬件结构上比较复杂、成本较高,很少用于自动驾驶汽车。
  •         调频连续波方式毫米波雷达:结构简单、体积小、成本低廉,容易实现近距离探测。

2.4 USS

        超声波雷达工作在机械波波段,工作频率在 20kHz以上。常用的工作频率有40kHz, 48kHz和58kHz三种。一般来说,频率越高,灵敏度越高,但水平与垂直方向的探测角度就越小,所以一般采用40kHz的探头。

        超声波雷达具有频率高、波长短、绕射现象小、方向性好、能够成为射线而定向传播等优点,且兼具防水、防尘的特性,因此非常适合应用于泊车。

2.5 高精地图

        高精地图是用于自动驾驶的专题地图,由含有语义信息的车道模型、道路部件(Object)、道路属性三类矢量信息,以及用于多传感器定位的特征(feature)图层构成。

        高精地图拥有精确的车辆位置信息和丰富的道路元素数据信息,起到构建类似于人脑对于空间的整体记忆与认知的功能,可以帮助汽车预知路面复杂信息,如坡度、曲率、航向等,更好地规避潜在的风险,是自动驾驶汽车的核心技术之一。

        相较于GPS导航系统的传统地图而言,高精地图最显著的特征是其表征路面特征的精准性。

2.6 精准定位

        自动驾驶汽车的环境感知还包括汽车的精准定位,不仅需要获取车辆与外界环境的相对位置关系,还需要通过车身状态感知确定车辆的绝对位置与方位。

        目前自动驾驶领域常见的几种精准定位方式包括惯性导航系统、轮速编码器与航迹推算、卫星导航系统以及SLAM自主导航系统等。

  • 惯性导航系统

         惯性导航系统是以陀螺和加速度计为敏感器件的导航参数解算系统,通过测量运动载体的线加速度和角速率数据,并将这些数据对时间进行积分运算,从而得到速度、位置和姿态。

        具体来说惯性导航系统属于一种推算导航方式。即从一已知点的位置根据连续测得的运载体航向角和速度推算出其下一点的位置,因而可连续测出运动体的当前位置。

  • 轮速编码器与航迹推算

        轮速编码器与航迹推算的原理是通过轮速编码器推算出自动驾驶汽车的位置。轮速编码器主要安装在汽车前轮,用于记录车轮行驶的总转数。通过分析每个时间段里左右轮的转数,可以推算出车辆向前行驶的距离和左右的偏转度。不过,由于在不同地面材质上转数对距离转换存在偏差,所以时间越久,测量偏差也会越大,这种定位方式更多以辅助的形式存在。

  • 卫星导航系统

        卫星导航系统主要包括中国的北斗卫星导航系统、美国的GPS卫星导航系统以及俄罗斯的GLONASS卫星导航系统。这些导航系统可以提供高精度的定位服务。

  • SLAM

        SLAM(即时定位与地图构建),也称为CML(并发建图与定位)。SLAM通过利用已经观测到的环境特征确定当前车辆的位置以及当前观测特征的位置。

        第一种是基于激光雷达的SLAM,以谷歌汽车为例。车辆携带有GPS,通过GPS 对位置进行判断,并以激光雷达SLAM点云图像与高精度地图进行坐标配准,匹配后确认自身位姿。

        第二种是基于视觉的SLAM,以Mobileye为例。Mobileye提出一种无需SLAM的定位方法——REM。车辆通过采集包括信号灯、指示牌等标识,得到了一个简单的三维坐标数据,再通过视觉识别车道线等信息,获取一个一维数据。摄像机中的图像与 REM 地图中进行配准,即可完成定位。

        目前,SLAM常用于自主导航,特别是在GPS无信号或不熟悉的地区的导航。

3、规划决策

        规划是为了某一目标而作出一些有目的性的决策的过程,通常是指从出发地到达目的地,同时避免障碍物,并且不断优化驾驶轨迹和行为以保证乘客的安全舒适。通常又被细分为任务规划(Mission Planning),行为规划(Behavioral Planning)和动作规划(Motion Planning)三层。

        在自动驾驶中,路径规划是决策的关键环节。车辆需要根据环境感知的结果,规划出安全、有效的行驶路径。路径规划的目标不仅是避免碰撞,还要考虑行驶的舒适性、效率和法规遵守。

        自动驾驶汽车在进行决策规划时,会从环境感知模块中获取道路拓扑结构信息、实时交通信息、障碍物(交通参与者)信息和主车自身的状态信息等内容。决策规划系统会对当前环境作出分析,然后对底层控制执行模块下达指令,这一过程就是决策规划模块的主要任务。

        换言之,自动驾驶汽车的行为决策与路径规划是指依据环境感知和导航子系统输出信息,通过一些特定的约束条件规划出给定多条可选安全路径,并从中选取一条最优路径作为车辆行驶轨迹的过程。

        3.1 技术结构体系

        自动驾驶决策规划领域常见的技术结构体系可分为分层递阶式、反应式以及二者混合式。

3.1.1 分层递阶式

        分层递阶式可以理解为一个串联结构,自动驾驶系统的各个模块有序排列在一条直线上,上一模块处理的内容将直接进入到下一阶段,如下图所示:

        优点:

  •         各模块次序分明
  •         每个模块所处理的工作范围逐渐缩小,处理问题的准确度逐渐上升,更容易实现高层次的智能控制。

        缺点:

  •         需要实时调用传感器信息,对传感器的要求较高。
  •         从环境感知到执行控制,中间存在一定延迟,缺乏实时性和灵活性。
  •         分层递阶式的串联结构存在可靠性不高的问题。整体系统的任何部分都不能出现问题,否则信息流和控制流的传递通道就会受到影响,整个系统会随时处于崩溃的状态中。

3.1.2 反应式

        反应式体系结构使用的是并联结构,如下图所示:

        决策规划模块内容以并联模式布置,环境感知的内容会同步传输至多个决策规划模块内,可突出“感知-动作”的特点,易于适应完全陌生的环境。

        与分层递阶式体系结构相比,反应式结构体系占用存储空间较小,响应快,实时性高。同时,并联结构提高了整体结构的稳定性,决策规划模块内的某一层内容出现故障,也不会影响到其他层级内容的正常运行。不过,这也提高了整体系统运行的复杂度,需要更高等级智能技术的支持。

3.1.3 混合式

        混合式体系结构将两者优点结合,全局规划与局部规划分别适用不同的体系结构,使得自动驾驶汽车能够更加适应复杂多变的真实路况。

3.2 技术方法

        根据对环境信息掌握程度的不同,路径规划可分为全局路径规划和局部路径规划两种。

3.2.1 全局路径规划

        全局路径规划,又可以称之为驾驶任务规划,主要内容为行驶路径范围的规划。

        全局路径规划会在已知环境中,给自动驾驶汽车规划出一条理想路径,路径规划的精度取决于环境感知模块获取信息的准确度。这是一种事前规划,类似于我们日常生活中常用的“导航”功能:输入出发地与目的地,APP就会自动规划出一条最优路径。

        需要注意的是,全局路径规划需要预先知道环境的准确信息,当环境发生变化时,规划结果很可能就会失效。

3.2.2 局部路径规划

        局部路径规划,又可称之为实时路径规划。自动驾驶汽车在有障碍物的环境中,会利用自身传感器实时感知周边环境,寻找出一条最优的局部行驶路径,避免碰撞和保持安全距离。

        局部路径规划的优势是可以实时对规划结果进行反馈与校正,确保了自动驾驶车辆始终处于最优的驾驶路径中。缺点是缺乏全局环境信息,可能发生找不到正确路径或完整路径的情况。

        总体而言,全局路径规划和局部路径规划并没有本质上的区别。两者协同工作,自动驾驶车辆可以更好地规划出最优路径。

4、执行

        自动驾驶控制执行系统是指系统做出决策规划以后,替代驾驶员对车辆进行控制,反馈到底层模块执行任务。车辆的各个操控系统需要通过总线与决策系统相连接,并能够按照决策系统发出的总线指令精确地控制加速程度、制动程度、转向幅度、灯光控制等驾驶动作,以实现车辆的自主驾驶。

4.1 核心技术

        自动驾驶控制执行的核心技术主要包括车辆的纵向控制和横向控制技术。

4.1.1 纵向控制

        纵向控制是指在行车速度方向上的控制,即车速以及与前后车或障碍物距离的自动控制。

        自动驾驶采用油门和制动综合控制的方法来实现对预定车速的跟踪,各种电机-发动机-传动模型、汽车运行模型和刹车过程模型与不同的控制算法相结合,构成了各种各样的纵向控制模式,典型的纵向控制系统结构如下图所示:

4.1.2 横向控制

        横向控制指转向控制。横向控制系统目标是控制汽车自动保持期望的行车路线,并在不同的车速、载荷、风阻、路况下均有很好的乘坐舒适性和稳定性。典型系统结构如下图所示:

4.2 技术方案

        根据从行驶环境到驾驶动作的映射过程,自动驾驶控制技术可以分为间接控制和直接控制两种不同方案。

4.2.1 基于规划- 跟踪的间接控制方法

        自动驾驶间接控制方案可以简单概括为,根据当前车辆行为需求,在满足车辆自身运动学和动力学约束条件下规划出一条空间上可行且时间上可控的无碰撞安全运动轨迹,然后设计适当的控制律跟踪生成的目标轨迹,从而实现自主驾驶。原理如下图所示:

4.2.2 基于人工智能的直接控制方法

        由于自动驾驶汽车行驶环境具有不确定性、不可重复性和不可预测性等特征,很难建立精确的数学模型进行控制律的设计,因此传统控制策略已无法满足自动驾驶驾驶控制的要求。这样的背景下,基于人工智能的直接控制方法就成为目前自动驾驶控制系统的主流形式。

        基于人工智能决策控制模型本质上是模拟人脑对外界环境信息和车体本身信息的感知,同时由驾驶经验并同在线学习机制来获得持续稳定输出的过程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/881079.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大学生就业招聘:Spring Boot系统的设计与实践

5系统详细实现 5.1 用户模块的实现 5.1.1 求职信息管理 大学生就业招聘系统的用户可以管理自己的求职信息,可以对自己的求职信息添加修改删除操作。具体界面的展示如图5.1所示。 图5.1 求职信息管理界面 5.1.2 首页 用户登录可以在首页看到招聘信息展示也一些求职…

Flet介绍:平替PyQt的好用跨平台Python UI框架

随着Python在各个领域的广泛应用,特别是在数据科学和Web开发领域,对于一个简单易用且功能强大的用户界面(UI)开发工具的需求日益增长。传统的Python GUI库如Tkinter、PyQt虽然功能强大,但在易用性和现代感方面略显不足…

算法篇1:双指针思想的运用(1)--C++

一.算法解析 双指针,顾名思义就是两个指针,常见的算法中,我们可以看到两种: 1.对撞指针:一般用于顺序结构,也称为左右指针。 对撞指针从两端向中间移动。一个指针从最左端开始,另一个从最右端…

比较搜索难度曲线5s1-4和4s1

在行列可自由变换的条件下,平面上的5点结构只有34个,4点结构有16个 (A,B)---6*n*2---(0,1)(1,0) 让B全是0。当收敛误差为7e-4,收敛199次取迭代次数平均值。让隐藏层节点数n分别为10,15,20,25,30&#xff…

C(十四)while、for、do-while循环综合(一)

uu们,小弟我本科在读,文章我会一直坚持更新下去,包括但不限于C初阶、C进阶、数据结构、C、Linux、MySQL、项目、QT开发、各种算法(之后会持续更新),并且站在小白的视角尽可能通俗易懂地把这些写出来&#x…

【Android】获取备案所需的公钥以及签名MD5值

目录 重要前提 获取签名MD5值 获取公钥 重要前提 生成jks文件以及gradle配置应用该文件。具体步骤请参考我这篇文章:【Android】配置Gradle打包apk的环境_generate signed bundle or apk-CSDN博客 你只需要从头看到该文章的配置build.gradle(app&…

25重庆长安深蓝控制器开发面试经验 深蓝最常见面试问题总结

【面试经历】 秋招气氛组选手的第一场面试,9.17网申,9.24电话约面,9.26线上面试。问得很细,全长约1个小时 1. 自我介绍、项目介绍 2.项目细节,遇到了哪些困难;有没有PCB设计经验DC-DC芯片选型,电源噪声的原因、怎么消除、 3.画BUCK和BOOST拓扑图,讲原理 4.了解MCU的主…

西电25考研 VS 24考研专业课大纲变动汇总

01专业课变动 西安电子科技大学专业课学长看到953网络安全基础综合变为 893网络安全基础综合,这是因为工科要求都必须是8开头的专业课,里面参考课本还是没变的,无非就是变了一个名字 对于其他变动专业课也是同理的 02专业课考纲内容变化 对于…

uniapp中检测应用更新的两种方式-升级中心之uni-upgrade-center-app

uniapp一个很是用的功能,就是在我们发布新版本的app后,需要提示用户进行app更新,并告知用户我们新版的app更新信息,以使得用户能及时使用上我们新开发的功能,提升用户的实用度和粘性。注意:这个功能只能在app端使用 效…

创建django项目时,不同的编译类型有什么区别

这里主要提及的是 project venv 和 Custom environment 两种类型。 简单来说,project venv 是Python 3.3及以上版本中自带的虚拟环境管理工具,使用venv可以为每个项目创建一个独立的环境:python -m venv myprojectenv (项目名后e…

【3D目标检测】激光雷达和相机联合标定(一)——ROS同步解包

ROS同步解包 引言1 鱼香ROS一键安装ros-docker脚本:2 指定目录映射3 数据解包3.1 解包脚本3.2 依赖安装3.3 运行脚本,解包 引言 总结步骤如下: 采集同步数据:ROS录制(推荐),或者代码同步触发采…

如何使用工具删除 iPhone 上的图片背景

在 iPhone 上删除背景图像变得简单易行。感谢最近 iOS 更新中引入的新功能。如今,iOS 用户现在可以毫不费力地删除背景,而无需复杂的应用程序。在这篇文章中,您将学习如何使用各种方法去除 iPhone 上的背景。这可确保您可以选择最适合您偏好的…

通信工程学习:什么是IP网际协议

IP:网际协议 IP网际协议(Internet Protocol,简称IP)是整个TCP/IP协议栈中的核心协议之一,它负责在网络中传送数据包,并提供寻址和路由功能。以下是对IP网际协议的详细解释: 一、对IP网际协议的…

哈尔滨自闭症学校寄宿条件与优势解析

自闭症儿童的希望之光:广州星贝育园寄宿制学校深度解析 在当今社会,自闭症儿童作为一群需要特别关注和照顾的群体,其教育与康复问题日益受到社会各界的重视。自闭症儿童不仅需要专业的康复训练,还需要一个稳定、温馨且充满爱的环…

Java:插入排序

目录 排序的概念 插入排序 直接插入排序 哈希排序 排序的概念 排序:所谓的排序,就是使一串记录,按照某个或某些关键字的大小,递增或递减的排列起来的操作。 稳定性:假定在待排序的记录序列中,存在多个…

【设计模式-解释模式】

定义 解释器模式是一种行为设计模式,用于定义一种语言的文法,并提供一个解释器来处理该语言的句子。它通过为每个语法规则定义一个类,使得可以将复杂的表达式逐步解析和求值。这种模式适用于需要解析和执行语法规则的场景。 UML图 组成角色…

Redis中String类型的常用命令(append,getrenge,setrange等命令)

Redis----String命令 前言.常见的String存储类型. 常见命令1. set 命令2. get 命令3. mget命令与mset命令4. setnx命令5. setex与psetex命令6. incr与incrby与incrbyfloat命令7. decr与decrby命令8. append命令9. getrange和setrange命令10. strlen命令. 前言. 常见的String存…

关于Generator,async 和 await的介绍

在本篇文章中我们主要围绕下面几个问题来介绍async 和await 🍰Generator的作用,async 及 await 的特点,它们的优点和缺点分别是什么?await 原理是什么? 📅我的感受是我们先来了解Generator,在去…

【AI学习】Mamba学习(二):线性注意力

上一篇《Mamba学习(一):总体架构》提到,Transformer 模型的主要缺点是:自注意力机制的计算量会随着上下文长度的增加呈平方级增长。所以,许多次二次时间架构(指一个函数或算法的增长速度小于二次…

linux下yum安装时出现Loaded plugins: fastestmirror的解决办法

一、centos7修改源 在CentOS 7中,修改系统软件源可以通过编辑/etc/yum.repos.d/目录下的.repo文件来实现。以下是一个基本的步骤和示例代码,用于将默认的软件源修改为阿里云的源。 备份当前的CentOS-Base.repo文件: sudo cp /etc/yum.repos.…