PaperNotes(18)-VectorNet- Encoding HD Maps and Agent Dynamics from Vectorized Representation

自动驾驶论文阅读笔记1

  • 1. Ployline Garph
  • 2. Global Graph
  • 3. 模型目标函数
  • 4.Related work
  • 5.Experiment
    • 5.1 实验设置
    • 5.2 消融实验
    • 5.3 模型资源消耗
    • 5.4 与其他模型的对比实验

VectorNet- Encoding HD Maps and Agent Dynamics from Vectorized Representation
VectorNet: 通过矢量化表示编码高精度地图与动态交通参与者
自动驾驶大佬waymo
论文翻译

目标:轨迹预测
方法:

  1. 向量化表示地图和移动agent(轨迹,车道线采样,每个点用特征向量表示)
  2. 利用local graph net 聚合每条折线的特征(全联接网路,一条折线最后凝练出一个特征向量–就是一个点)
  3. 利用全局graph聚合各个折线特性点的相互作用(全局图就是各个结点全联接构成的图,经过一层状态更新后通过解码网络得到目标对象的预测轨迹–轨迹的一步坐标位移)

(损失函数的设置,附加恢复网络等等细节需要去看原文)

20210426–(资料表明是CVPR2020的文章,但是标了arxiv:2005.就表示迷惑了)

road components

  1. moving agents(pedestrians, vehicles)
  2. road context information(lanes, traffic lights)

1. Ployline Garph

  1. 向量化
    地图特征(车道线,交叉路口)-选定起点和方向,在spline(样条)上等空间间隔采样,连接相邻点构成向量,运动轨迹-等时间间隔采样关键点,构成向量。一条轨迹Pj\mathcal{P}_jPj就是一个向量集合{v1,v2,...,vp}\{v_1,v_2,...,v_p\}{v1,v2,...,vp}
    曲线Pj\mathcal{P}_jPj向量viv_ivi-向量的dis,died_i^s,d_i^edis,die起始和终止点的坐标;aia_iai对象类型、时间戳、道路类型、限速;j是轨迹编号:
    vi=[dis,die,ai,j]v_i=[d_i^s,d_i^e,a_i,j]vi=[dis,die,ai,j]

  2. 折线子图–polyline subgraphs
    同一条折线(polyline)上的节点构成一张子图,节点特征更新规则:
    vi(l+1)=φrel[genc(vi(l)),φagg({ggen(vj(l))})]v_i^{(l+1)}=\varphi_{rel}[g_{enc}(v_i^{(l)}),\varphi_{agg}(\{g_{gen}(v_j^{(l)})\})]vi(l+1)=φrel[genc(vi(l)),φagg({ggen(vj(l))})]
    gencg_{enc}genc–MLP–处理每个节点的特征。同层结点权值共享,不同层权重不同
    φagg\varphi_{agg}φagg–最大池化–聚合邻居结点的信息
    φrel\varphi_{rel}φrel–concatenation(简单的连接操作)–本结点特征和邻居结点特征相互结合
    堆叠多层genc(⋅)g_{enc}(·)genc()操作

  3. 折线的表征–同一条折线上所有结点特征经过一个最大池化操作,聚合特征
    p=φagg({vi(Lp)})\bm{p}=\varphi_{agg}(\{v_i^{(L_p)}\})p=φagg({vi(Lp)})

注:

  1. 起始和终止点的坐标–二维/三维都可以
  2. 目标agent最后一次被观察到的time step/位置 作为时间或者空间的原点。
  3. 折线子图可以看作是PointNet的一般化–在PointNet中,ds=ded^s=d^eds=deaaalll为空。但是本文作者表明,odering 信息,连接性约束(没发现呀,和l有关?)使得本文子图网络能够更好的编码结构化的信息。

2. Global Graph

  1. 全局图
    折线结点{p1,p2,...,pP}\{p_1, p_2,...,p_P\}{p1,p2,...,pP}构造全局图,A–邻接矩阵–为了简单起见,本文采用全联接图。
    {pi(l+1)}=GNN({pi(l)},A)\{p_i^{(l+1)}\}=GNN(\{p_i^{(l)}\},A){pi(l+1)}=GNN({pi(l)},A)
    图具体计算采用self-attention操作:
    GNN(P)=softmax(PQ,PKT)PVGNN(P)=softmax(P_Q,P_K^T)P_VGNN(P)=softmax(PQ,PKT)PV
    P为结点的特征矩阵,PQ,PK,PVP_Q,P_K,P_VPQ,PK,PV是P的线形投影(具体操作没说)

  2. 预测moving agents的未来轨迹
    vifuture=φtraj(pi(Lt))v_i^{future}=\varphi_{traj}(p_i^{(L_t)})vifuture=φtraj(pi(Lt))

φtraj(⋅)\varphi_{traj}(\cdot)φtraj()–轨迹解码器–MLP
(本文GNN网络只有一层,所以在推断的时候,只需要计算target agent的特征。)

  1. 附加图补全任务–auxiliary graph completion task
    为了使图捕获轨迹和车道线强交互,在训练时,隐藏一部分折线结点特征向量,用模型去预测该特征:
    p^i=φnode(pi(Lt))\hat{p}_i=\varphi_{node}(p_i^{(L_t)})p^i=φnode(pi(Lt))
    φnode(⋅)\varphi_{node}(\cdot)φnode()–结点特征解码器-MLP,目标函数和BERT的目标函数相似。
    (这一点写的不是很明白,φnode(⋅)\varphi_{node}(\cdot)φnode()输入特征的构造这一点)

论文解读:Attention is All you need
Transformer–论文翻译:Attention Is All You Need 中文版
论文笔记:Attention is all you need

3. 模型目标函数

多目标优化目标函数:
L=Ltraj+αLnode\mathcal{L}=\mathcal{L}_{traj} + \alpha\mathcal{L}_{node}L=Ltraj+αLnode

Ltraj\mathcal{L}_{traj}Ltraj–负高斯对数似然, 轨迹是二维随机变量,作二元高斯分布假设,使用最大似然法。二元正态分布的概率密度函数
Lnode\mathcal{L}_{node}Lnode–Huber损失函数,预测点的特征和masked 节点特征??

为了避免由 优化Lnode\mathcal{L}_{node}Lnode使得结点特征的幅度较小 而引起的平凡解,将结点特征L2正则化后再输入到后续的网路中。


20210430-还剩下related work 和实验部分没有整理

4.Related work

(介绍了4个部分的相关工作)

  1. 自动驾驶中的行为预测–IntentNet, ConvNets, MultiPath…
  2. 多agent交互预测
  3. entities 集合的表征学习–图结点的表示方式
  4. 自监督建模–来自NLP中单词补全任务

5.Experiment

5.1 实验设置

1 数据集
两个车辆行为预测bench-marks

  1. Argoverse dataset:简介 每条轨迹5s,前2s作为观测,后3s作为标签
  2. in-house behavior prediction dataset: 每条轨迹4s,前1s作为观测,后3s作为标签

两个数据集的历史轨迹都是从感知模型来的,所以有噪声(感知建模不准嘛)。Argoverse dataset的标签轨迹也是从感知来的,in-house behavior prediction dataset的标签轨迹是经过手工标记过的。

2 度量
ADE-Average Displacement Error–平均偏移误差,在时间t=1.0,2.0,3.0st=1.0,2.0,3.0st=1.0,2.0,3.0s预测轨迹处的偏移量,单位是米。

3 baseline–ConvNet
从最后一次观测到vehicle的帧开始,往前render N 个连续的帧,每一帧的分辨率为4004003。对于Argoverse 数据集来说400像素代表了130米,in-house数据集来说400像素代表了100米。将N帧堆叠在一起,形成一个4004003N 的图像输入数据。

ConvNet 网络模型输入数据的处理:crop the feature patch around the target vehicle from the convolutional feature map, and average pool over all the spatial locations of the cropped feature map to get a single vehicle feature vector。并且针对卷积的感受野,特征剪裁策略,和分辨率分别做了消融实验。

4 VectorNet
原则-尽量保证于ConVNet具有相同的输入信息(对比实验嘛,怎么公平怎么来)。 折线子图采用3层结构,全局图为一层结构,MLP 是64个结点。对context information,子图和全局图的层数做了消融实验。

5.2 消融实验

1.ConvNet 网络消融实验–卷积核、Crop 尺寸、图像分辨率
2.VectorNet 网络的消融实验–Context、Node Compl、子图和全局图的层数

5.3 模型资源消耗

FLOPs : FLOATING-POINT OPERATIONS PER SECOND–每秒浮点数计算
模型尺寸:

似乎pytorch可以有专门计算的接口: profile

5.4 与其他模型的对比实验

state-of-art: Agoverse Forecasting 挑战赛的冠军。结果统计在表格5中,VectorNet完胜。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/444724.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ubuntu的apache配置https

一、配置Apache 1、开启SSL模块a2enmod ssl 2、启用SSL站点a2ensite default-ssl 3、加入监听端口vi /etc/apache2/ports.conf #编辑Apache端口配置,加入443端口 Listen 443注:Ubuntu启用SSL站点后,缺省已经加入了 (…

vim特别好的教程

欢 迎 阅 读 《 V I M 教 程 》 —— 版本 1.7 Vim 是一个具有很多命令的功能非常强大的编辑器。限于篇幅,在本教程当中 就不详细介绍了。本教程的设计目标是讲述一些必要的基本命令,而掌握好这 些命令&#x…

jquery、javascript实现(get、post两种方式)跨域解决方法

&#xfeff;&#xfeff;jquery、javascript实现(get、post两种方式)跨域解决方法一、实现get方式跨域请求数据浏览器端<script> $(document).ready(function(){$.ajax({url: "http://www.xxx.cn/index.php",type: "get",dataType: "jsonp&quo…

推荐系统(4)-逻辑回归LR、POLY2、FM、FFM

逻辑回归LR、POLY2、FM、FFM1.逻辑回归LR2.辛普森悖论3.POLY24.FM-20105.FFM6.GBDTLR-20147.LS-PLM-2017《深度学习/推荐系统》读书笔记1.逻辑回归LR Logistic Regression – 融合多种特征&#xff0c;通过sigmoid 函数&#xff0c;预测样本的被点击的概率。样本用特征向量x[x…

leetcode125验证回文串

给定一个字符串&#xff0c;验证它是否是回文串&#xff0c;只考虑字母和数字字符&#xff0c;可以忽略字母的大小写。 说明&#xff1a;本题中&#xff0c;我们将空字符串定义为有效的回文串。 示例 1: 输入: "A man, a plan, a canal: Panama" 输出: true 示例 …

配置 Elastic Beanstalk 环境负载均衡器以终止 HTTPS

&#xfeff;&#xfeff;配置 Elastic Beanstalk 环境负载均衡器以终止 HTTPS 要更新您的 AWS Elastic Beanstalk 环境以使用 HTTPS&#xff0c;您需要为您的环境中的负载均衡器配置 HTTPS 侦听器。以下两种类型的负载均衡器支持 HTTPS 侦听器&#xff1a;传统负载均衡器和应用…

AWS 给负载均衡器配置侦听器并上传IAM证书

&#xfeff;&#xfeff;1.打开EC2的负载均衡器&#xff1a;添加侦听器&#xff0c;选择https&#xff0c;ssl证书需要有一个CA证书&#xff0c;可以去阿里云申请&#xff0c;也可以从亚马逊获取&#xff1a;注意&#xff0c;这里的ssl证书要这样写其中私有密钥不是那种xxxxxx…

PaperNotes(19)-Learning Lane Graph Representations for Motion Forecasting

Learning Lane Graph Representations for Motion Forecasting1.ActorNet2.MapNet3.FusionNet4.Prediction Header5.模型参数学习自动驾驶论文阅读笔记2 Uber–ECCV2020–论文文章代码 模型的作用&#xff1a;Motion Forecasting &#xff08;这个motion都包括什么呢&#xff…

leetcode41 缺失的第一个正数

给定一个未排序的整数数组&#xff0c;找出其中没有出现的最小的正整数。 示例 1: 输入: [1,2,0] 输出: 3 示例 2: 输入: [3,4,-1,1] 输出: 2 示例 3: 输入: [7,8,9,11,12] 输出: 1 说明: 你的算法的时间复杂度应为O(n)&#xff0c;并且只能使用常数级别的空间。 思路&am…

Linux(10)-Make编译,Configure

Make编译机制,Configure1.Make机制demo1.make编译demo2.make清理demo3:make 安装demo4:make 卸载2.configure2.1 Autoconf2.2 软件的源码安装软件发布的一些基础知识。gcc, cpp, as, ld–施工队&#xff0c;底层干活工人make --包工头&#xff0c;指挥工人工作configure–分析师…

redis排行榜之日排行周排行设计

排行榜功能是一个很普遍的需求。使用 Redis 中有序集合的特性来实现排行榜是又好又快的选择。 一般排行榜都是有实效性的,比如“用户积分榜”。如果没有实效性一直按照总榜来排,可能榜首总是几个老用户,对于新用户来说,那真是太令人沮丧了。 首先,来个“今日积分榜”吧,…

Linux(11)-Ubuntu装系统

Ubuntu18.04装系统单系统双系统启动项dell 5820进不去bios。单系统 装过好多次ubuntu系统&#xff0c;每次要重装之前总是得搜索各种教程。现在总结一份简略教程如下&#xff0c;以备哪天装系统之需。 1.官网上下载Ios文件:https://ubuntu.com/download/desktop 2.找一个U盘…

最近准备学习下mongodb(一 Windows安装篇)

1 先安装mongodb 的windows版本&#xff0c;Linux的我后期会加上的。 https://www.mongodb.com/dr/fastdl.mongodb.org/win32/mongodb-win32-x86_64-2008plus-ssl-4.0.0-signed.msi/download 2.安装php扩展插件&#xff1a; https://pecl.php.net/package/mongo 根据自己的…

leetcode139 单词拆分

给定一个非空字符串 s 和一个包含非空单词列表的字典 wordDict&#xff0c;判定 s 是否可以被空格拆分为一个或多个在字典中出现的单词。 说明&#xff1a; 拆分时可以重复使用字典中的单词。 你可以假设字典中没有重复的单词。 示例 1&#xff1a; 输入: s "leetcode…

Linux(12)-Ubuntu装机后的基础应用

Ubuntu装机ssh服务器 sudo ps -e |grep ssh # 查看ssh 服务安装情况 ssh-agent--ssh客户端&#xff0c;连别人&#xff1b; sshd--ssh服务器&#xff0c; 被别人连 sudo apt-get update # 更新软件源 sudo apt-get install openssh-server # 安装ssh服务端ssh设置别…

OpenSSL编写SSL,TLS程序

一、简介:SSL(Secure Socket Layer)是netscape公司提出的主要用于web的安全通信标准,分为2.0版和3.0版.TLS(Transport Layer Security)是IETF的TLS 工作组在SSL3.0基础之上提出的安全通信标准,目前版本是1.0,即RFC2246.SSL/TLS提供的安全机制可以保证应用层数据在互联网络传输不…

PRML(3)--Chapter2(上)-概率分布-二元变量、多项式变量、高斯分布、指数族分布

PRML第二章上-概率估计2.1二元变量2.1.1 beta 分布2.2 多项式变量2.3 高斯分布2.3.1条件高斯分布、2.3.2边缘高斯分布2.3.3 高斯变量的贝叶斯定理2.3.4 高斯分布的最大似然估计2.3.5 顺序估计2.3.6 高斯分布的贝叶斯推断2.3.7 学生t分布2.3.8周期性变量2.3.9混合高斯分布2.4 指…

leetcode27 移除元素

给定一个数组 nums 和一个值 val&#xff0c;你需要原地移除所有数值等于 val 的元素&#xff0c;返回移除后数组的新长度。 不要使用额外的数组空间&#xff0c;你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。 元素的顺序可以改变。你不需要考虑数组中超出新…

Harris的角点检测和特征匹配

一.特征检测&#xff08;提取&#xff09; 基于特征的图像配准方法是图像配准中最常见的方法之一。它不是直接利用图像像素值&#xff0c;二十通过像素值导出的符号特征&#xff08;如特征点、特征线、特征区域&#xff09;来实现图像配准&#xff0c;因此可以克服利用灰度信息…

开始入坑深度学习(DeepLearning)

现在游戏越来越难做,国家广电总局审核越来越变态,国家各种打压游戏,游戏产业也成为教育失败的背锅侠,所以本人现在开始做深度学习方向。 深度学习研究的热潮持续高涨,各种开源深度学习框架也层出不穷,其中包括TensorFlow、Caffe、Keras、CNTK、Torch7、MXNet、Leaf、The…