【论文精读】Exploring the Causality of End-to-End Autonomous Driving

背景信息

团队:百度
代码:https://github.com/bdvisl/DriveInsight
论文思想简述:这篇论文并不是提出SOTA模型,而是提出了一些评估模型的方法。

目前已有的分析方法

  1. 大语言模型。VAQ来提供解释性,比如DriveVLM,问题是存在inaccurate explanations(这个问题怎么证明?
  2. 因果注意力模块,比如NEAT(Neat: Neural attention fields for end-to-end
    autonomous driving,2021, ICCV)(我没看过,不懂
  3. 反事实解释conterfactual explanation。比如Octet(Octet:
    Object-aware counterfactual explanations,2023,CVPR)(我没看过,不懂
  4. 辅助任务auxiliary tasks。辅助输出目标检测、语义分割、障碍物预测等。
  5. 因果鉴定casual identification。多种输入可能导致因果迷惑casual confusion,PlanTF等在尝试解决。
    本文先定性分析因果因素causal factors,然后定量分析每个因素的贡献。

模型评估方法

先自己搭了一个模型

  1. image encoder -> Resnet with fetrure pyramid network
  2. lidar encoder -> 3D sparse convolution + hourglass vonvolution
  3. multi-modal fusion -> fuse image and lidar input -> 2D convolution + Squeeze and Excitation blocks -> BEV_t
  4. temporal fusion -> 多个历史时刻下BEV -> convolution + SE blocks
  5. planning decoder -> fused BEV + ego vehicle status + environment(HD, obs, traffic lights, stop signs) + navigation(command, target point, routing)

模型结果评估

  1. RC, route completion
  2. IS, infration score
  3. DS, driving score,上述之乘积

模型因果评估

消融实验

BEV,routing,目标位置必不可少(为什么模型要target point呢?这是不是提示太明显了
历史速度信息可以去掉,没啥影响

反事实干涉conterfactual intervention

  1. 如果输入错误的routing和目标位置,模型是会出错的the behavior of the ego vehicle can be successfully intervened;
  2. 当前速度有很大影响。很无聊,肯定会学错的;
  3. Map没啥影响,因为BEV已经给足够的信息了;
  4. Traffic light有很大影响。废话。

可视化分析

  1. 不同token的梯度,反应当前的关注程度(为啥得是梯度呢?
  2. 不同head中,不同token的梯度,反应不同head对信息的倾向程度preferences
  3. 激活地图可视化activation map visualization。(看不明白为什么要对p求偏导)。反映对场景中不同区域的关注程度。

评价

  1. 有些方法早已经在用了(消融实验)
  2. 有些点很小(反事实干涉,名字比较高大上)
  3. 可视化分析的充分性如何证明?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/44135.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++基础(二)

目录 1.类和对象 1.1类的定义 1.2访问限定符 1.3类域 2.实例化 2.1实例化概念 2.2对象大小 3.this指针 4.类的默认成员函数 4.1构造函数 4.2析构函数 4.5运算符重载 1.类和对象 1.1类的定义 类的定义格式 class为定义类的关键字,Stack为类的名字&…

7月11日学习打卡,数据结构栈

大家好呀,本博客目的在于记录暑假学习打卡,后续会整理成一个专栏,主要打算在暑假学习完数据结构,因此会发一些相关的数据结构实现的博客和一些刷的题,个人学习使用,也希望大家多多支持,有不足之…

dataX入门

下载dataX https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202308/datax.tar.gz 然后 下载后解压至本地某个目录,进入bin目录,即可运行同步作业: $ cd {YOUR_DATAX_HOME}/bin $ python datax.py {YOUR_JOB.json} 要求你有python…

vue-grid-layout详解

vue-grid-layout 教程 vue-grid-layout 是一个用于 Vue.js 的响应式拖放网格布局组件,允许开发者创建可调整大小、可拖放的布局,广泛用于仪表板、管理面板等复杂布局需求。本教程将介绍如何安装、配置和使用 vue-grid-layout。 目录 安装基本使用 布局…

怎样在 C 语言中进行类型转换?

🍅关注博主🎗️ 带你畅游技术世界,不错过每一次成长机会! 📙C 语言百万年薪修炼课程 通俗易懂,深入浅出,匠心打磨,死磕细节,6年迭代,看过的人都说好。 文章目…

暑假自律日记九

7.10 (半小时日记打卡之——暑假第九天) 前言:或许是累了,今天的效率和进度可以说是历史最低了,调休了一天,算是歇会 日程 八点二十起床,在床上赖了一会 九点二十抵达逸夫楼,开始补…

kafka发送消息流程

配置props.put(ProducerConfig.PARTITIONER_CLASS_CONFIG, RoundRobinPartitioner.class); public Map<String,Object> producerConfigs(){Map<String,Object> props new HashMap<>();props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,bootstrapServers…

Spring Boot中的安全配置与实现

Spring Boot中的安全配置与实现 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01;今天我们将深入探讨Spring Boot中的安全配置与实现&#xff0c;看看如何保护你的…

在表格中把tab换成enter键------ivx

为了方便用户输入&#xff0c;把tab键替换成enter回车 方法如下&#xff1a; 添加一个fx函数 document.addEventListener(‘keydown’, function(event) { if (event.key ‘Enter’ && !event.shiftKey) { event.preventDefault(); var focusableElements document.q…

昇思25天打卡营-mindspore-ML- Day22-应用实践-自然语言处理-LSTM+CRF序列标注

昇思25天打卡营-mindspore-ML- Day22-应用实践-自然语言处理-LSTMCRF序列标注 今天学习了 LSTMCRF 序列标注方法&#xff0c;它是一种结合了循环神经网络&#xff08;RNN&#xff09;和条件随机场&#xff08;CRF&#xff09;的强大模型&#xff0c;用于处理序列标注问题&#…

【C++BFS】690. 员工的重要性

本文涉及知识点 CBFS算法 LeetCode690. 员工的重要性 你有一个保存员工信息的数据结构&#xff0c;它包含了员工唯一的 id &#xff0c;重要度和直系下属的 id 。 给定一个员工数组 employees&#xff0c;其中&#xff1a; employees[i].id 是第 i 个员工的 ID。 employees[…

RabbitMQ 高级功能

RabbitMQ 是一个广泛使用的开源消息代理&#xff0c;它支持多种消息传递协议&#xff0c;可以在分布式系统中用于可靠的消息传递。除了基本的消息队列功能外&#xff0c;RabbitMQ 还提供了一些高级功能&#xff0c;增强了其在高可用性、扩展性和灵活性方面的能力。以下是一些主…

软件架构之嵌入式系统设计(2)

软件架构之嵌入式系统设计&#xff08;2&#xff09; 12.4 嵌入式网络系统12.4.1 现场总线网12.4.2 家庭信息网11.4.3 无线数据通信网12.4.4 嵌入式 Internet 12.5 嵌入式数据库管理系统12.5.1 使用环境的特点12.5.2 系统组成与关键技术 12.6 实时系统与嵌入式操作系统12.6.1 嵌…

MyBatis(38)MyBatis 如何与 Spring Boot 集成,有哪些实践技巧

集成MyBatis与Spring Boot可以极大地提升开发效率&#xff0c;简化配置&#xff0c;并利用Spring Boot的自动配置特性优化项目结构和性能。下面我们将详细探讨如何实现这一集成&#xff0c;并分享一些实践技巧。 1. 添加依赖 首先&#xff0c;在pom.xml中添加MyBatis和Spring…

AI学习指南机器学习篇-聚类树的剪枝

AI学习指南机器学习篇-聚类树的剪枝 在机器学习领域&#xff0c;聚类是一种常用的无监督学习方法&#xff0c;通过对数据进行分组来发现数据中的结构和模式。聚类树是一种常用的聚类算法之一&#xff0c;它通过构建一个树状结构来展示聚类的层次关系&#xff0c;并能够帮助我们…

Linux 忘记root密码,通过单用户模式修改

银河麒麟桌面操作系统 V10&#xff08;sp1&#xff09;”忘记用户密码&#xff0c;需要修改用户密码所写&#xff0c;可用于 X86 架构和 arm 架构。 2. 选择第一项&#xff0c;在上图界面按“e”键进行编辑修改。 3. 在以 linux 开头这行的行末&#xff0c;添加“init/bin/bas…

Rockchip Android平台编译生成userdata.img

Rockchip Android平台编译生成userdata.img 适用版本 本修改方法适用于Android12及以上版本 代码修改 device/rockchip/rk3576&#xff1a; --- a/rk3576_u/BoardConfig.mkb/rk3576_u/BoardConfig.mk-28,4 28,7 PRODUCT_KERNEL_CONFIG pcie_wifi.configBOARD_GSENSOR_MXC…

SSE(Server-Send-Event)服务端推送数据技术

SSE&#xff08;Server-Send-Event&#xff09;服务端推送数据技术 大家是否遇到过服务端需要主动传输数据到客户端的情况&#xff0c;目前有三种解决方案。 客户端轮询更新数据。服务端与客户端建立 Socket 连接双向通信服务端与客户建立 SSE 连接单向通信 几种方案的比较&…

【前端】fis框架学习

文章目录 1. 介绍 1. 介绍 FIS是专为解决前端开发中自动化工具、性能优化、模块化框架、开发规范、代码部署、开发流程等问题的工具框架。 使用FIS我们可以快速的完成各种前端项目的资源压缩、合并等等各种性能优化工作&#xff0c;同时FIS还提供了大量的开发辅助功能 首先我们…

Nginx上配置多个网站

一、需求描述 我们只有一台安装了Nginx的服务器,但是我们需要实现在这台服务器上部署多个网站,用以对外提供服务。 二、Nginx上配置多个网站分析 一般网站的格式为:【http://ip地址:端口号/URI】(比如:http://192.168.3.201:80),IP地址也可用域名表示;那么要实现在Nginx…