KITTI自动驾驶数据集可视化教程

在这里插入图片描述
本文介绍关于自动驾驶数据集KITTI的基本操作,包括CameraLiDAR可视化教程,源码已上传:https://download.csdn.net/download/cg129054036/20907604


1. 数据准备

KITTI 数据 (calib, image_2, label_2, velodyne) 添加到 dataset/KITTI/object/training文件夹下。
目录文件结构如下:

├── dataset
│   ├── KITTI
│   │   ├── object
│   │   │   ├──KITTI
│   │   │      ├──ImageSets
│   │   │   ├──training
│   │   │      ├──calib & velodyne & label_2 & image_2 
├── kitti_object.py
├── kitti_test.py
├── kitti_util.py
├── viz_util.py

2. Requirements

为了显示物体 2D bbox3D bboxUbuntu系统需要安装以下工具:

  • mayavi
  • pillow
  • vtk
  • opencv
  • PIL
  • matplotlib
  • numpy

3. 可视化操作

下面依次展示 KITTI 数据集可视化结果,可视化操作代码存放在 kitti_test.py 文件中,这里通过设置 data_idx=10 来展示编号为000010的数据,共有9种可视化操作,依次为:

  • 图片显示
  • 图片上绘制2D bbox
  • 图片上绘制3D bbox
  • Lidar在图片上投影
  • LidarFOV图
  • Lidar三维可视化
  • Lidar绘制3D bbox
  • Lidar鸟瞰图
  • Lidar鸟瞰图绘制2D bbox

代码中dataset需要修改为数据集实际路径

def visualization():import mayavi.mlab as mlabdataset = kitti_object(os.path.join(ROOT_DIR, '../dataset/KITTI/object')) # determine data_idxdata_idx = 10# Load data from datasetobjects = dataset.get_label_objects(data_idx) print("There are %d objects.", len(objects))img = dataset.get_image(data_idx)             img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)img_height, img_width, img_channel = img.shape pc_velo = dataset.get_lidar(data_idx)[:,0:3]  calib = dataset.get_calibration(data_idx)   

(1) 图片显示

Image.fromarray(img).show()

在这里插入图片描述
(2) 图片上绘制2D bbox

这里KITTI 数据集给出了目标在图片上的坐标位置 (Xmin, Ymin, Xmax, Ymax),直接绘图即可。

show_image_with_boxes(img, objects, calib, False)

在这里插入图片描述
(3) 图片上绘制3D bbox

绘制物体 3D bbox时,需要进行坐标系转换,KITTI 数据集中给出的是物体在相机坐标系的位置 (x,y,z),根据物体 bbox 尺寸(h,w,l) 首先计算 3D bbox 8个顶点坐标,然后借助标定文件将其转换为图片坐标系坐标 (u, v)

show_image_with_boxes(img, objects, calib, True)

在这里插入图片描述
(4) Lidar在图片上投影

Lidar 坐标下各 point 坐标转换为图片坐标系下坐标,然后根据图片尺寸选取投影点。

show_lidar_on_image(pc_velo, img, calib, img_width, img_height)

在这里插入图片描述
(5) LidarFOV图

imgfov_pc_velo, pts_2d, fov_inds = get_lidar_in_image_fov(pc_velo, calib, 0, 0, img_width, img_height, True)
draw_lidar(imgfov_pc_velo, show=True)

在这里插入图片描述
(6) Lidar三维可视化

 draw_lidar(pc_velo, show=True)

在这里插入图片描述
(7) Lidar绘制3D bbox

绘制Lidar3D bbox时,需要进行坐标系转换,KITTI 数据集中给出的是物体在相机坐标系的位置(x,y,z),这里借助标定文件将其转换为Lidar坐标系下位置,同时借助物体bbox 尺寸(h,w,l)计算3D框8个顶点坐标。

show_lidar_with_boxes(pc_velo, objects, calib,  True, img_width, img_height)

在这里插入图片描述
(8) Lidar鸟瞰图

鸟瞰图绘制时将点云数据进行了预处理,只选取 x 坐标位于[0,70.4],y坐标位于[-40,40]的有效点。

show_lidar_topview(pc_velo, objects, calib)

在这里插入图片描述
(9) Lidar鸟瞰图绘制2D bbox

绘制时为了区分物体距激光雷达距离,将30米内目标使用绿色标志30米-50米内目标使用红色标志50米以外目标使用蓝色标志(场景0000010无此距离目标。)

img1 = cv2.imread('000010_BEV.png')
img = cv2.cvtColor(img1, cv2.COLOR_BGR2RGB)
show_lidar_topview_with_boxes(img1, objects, calib)

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/439603.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【CodeForces - 746E】Numbers Exchange(贪心构造)

题干: Eugeny has n cards, each of them has exactly one integer written on it. Eugeny wants to exchange some cards with Nikolay so that the number of even integers on his cards would equal the number of odd integers, and that all these numbers w…

java synchronized 关键字(1)对象监视器为Object

在java多线程中 synchronized 是非常重要的,也是经常用到的 对于synchronized关键字要注意两点 synchronized对象监视器为Object的时候 synchronized对象监视器为Class的时候 对象监视器为Object 也就是synchronized锁定的是对象 例如下面代码 public class A …

重读经典《Quaternion kinematics for the error-state Kalman filter》

本文将介绍一篇关于 四元数运动学的误差卡尔曼滤波 经典论文。本文结构如下: 第1章四元数定义和性质介绍,包括:加法、减法、乘法(矩阵表示)、模、幂数、指数运算等。第2章旋转群定义和性质介绍,包括&#…

【CodeForces - 789C】Functions again(最大子段和变形,dp,思维)

题干: Something happened in Uzhlyandia again... There are riots on the streets... Famous Uzhlyandian superheroes Shean the Sheep and Stas the Giraffe were called in order to save the situation. Upon the arriving, they found that citizens are wo…

一步步编写操作系统 55 CPL和DPL入门2

接上节。 图中第132行的jmp指令,段选择子为SELECTOR_CODE,其RPL的值为RPL0,RPL0定义在include/boot.inc中,其值为0。选择子的索引部分值为1,表示对应GDT中第1个段描述符,该描述符的DPL为0,&…

详解停车位检测算法 Vision-Based Parking-Slot Detection: A DCNN-Based Approach and a Large-Scale Benchmark

本文介绍一篇基于深度学习的停车位检测论文:DeepPS,作者同时公开了数据集ps2.0,工作很扎实,对于入门停车位检测很有帮助,论文发表在 IEEE T-IP 2018。 项目链接为:https://cslinzhang.github.io/deepps/ 0…

【CodeForces - 789D】Weird journey(思维,图的性质,tricks,有坑)

题干: Little boy Igor wants to become a traveller. At first, he decided to visit all the cities of his motherland — Uzhlyandia. It is widely known that Uzhlyandia has n cities connected with m bidirectional roads. Also, there are no two roads…

Monitor(管程)是什么意思?Java中Monitor(管程)的介绍

本篇文章给大家带来的内容是关于Monitor(管程)是什么意思?Java中Monitor(管程)的介绍,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 monitor的概念 管程&#x…

详解经典GPS辅助惯性导航论文 A GPS-aided Inertial Navigation System in Direct Configuration

本文介绍一篇 IMU 和 GPS 融合的惯性导航论文,重点是理解本文提出的:Dynamical constraints update、Roll and pitch updates 和 Position and heading updates。 论文链接为:https://www.sciencedirect.com/science/article/pii/S166564231…

【POJ - 2151】Check the difficulty of problems(概率dp)

​​​​题干: Organizing a programming contest is not an easy job. To avoid making the problems too difficult, the organizer usually expect the contest result satisfy the following two terms: 1. All of the teams solve at least one problem. 2.…

jsp之九大内置对象与四大域对象

一,什么是内置对象? 在jsp开发中会频繁使用到一些对象,如ServletContext HttpSession PageContext等.如果每次我们在jsp页面中需要使用这些对象都要自己亲自动手创建就会特别的繁琐.SUN公司因此在设计jsp时,在jsp页面加载完毕之后自动帮开发者创建好了这些对象,开发者只需要使…

详解停车位检测论文:Attentional Graph Neural Network for Parking-slot Detection

本文介绍一篇注意力图神经网络用于停车位检测论文,论文已收录于 RA-L2021。在之前的基于卷积神经网络的停车位检测方法中,很少考虑停车位标记点之间的关联信息,从而导致需要复杂的后处理。在本文中,作者将环视图中的标记点看作图结…

【Codeforces - 769D】k-Interesting Pairs Of Integers(暴力,统计,思维,数学,异或)

题干: Vasya has the sequence consisting of n integers. Vasya consider the pair of integers x and y k-interesting, if their binary representation differs from each other exactly in k bits. For example, if k  2, the pair of integers x  5 and …

JSP的三六九四七(三大指令、六大标签、九大内置对象、四大作用域、七个动作指令)

JSP的基本构成&#xff1a;HTML文件Java片断JSP标签 三大指令&#xff1a;page指令、include指令、taglib指令。 page指令: 1.language属性&#xff1a;设置当前页面中编写JSP脚本使用的语言&#xff0c;默认值为java。 <%page language"java"%> 2.content…

详解3D物体检测模型 SPG: Unsupervised Domain Adaptation for 3D Object Detection via Semantic Point Generation

本文对基于激光雷达的无监督域自适应3D物体检测进行了研究&#xff0c;论文已收录于 ICCV2021。 在Waymo Domain Adaptation dataset上&#xff0c;作者发现点云质量的下降是3D物件检测器性能下降的主要原因。因此论文提出了Semantic Point Generation (SPG)方法&#xff0c;首…

【CodeForces - 722D】Generating Sets(二分,贪心)

题干&#xff1a; You are given a set Y of n distinct positive integers y1, y2, ..., yn. Set X of n distinct positive integers x1, x2, ..., xn is said to generate set Y if one can transform X to Y by applying some number of the following two operati…

Waymo研发经理:《自动驾驶感知前沿技术介绍》

Waymo研发经理|自动驾驶感知前沿技术介绍这是Waymo研发经理&#xff08;VoxelNet作者&#xff09;的一个最新分享报告&#xff1a;《自动驾驶感知前沿技术介绍》。在这份报告里&#xff0c;介绍了Waymo在自动驾驶感知中五个研究方向的最新成果。 1. Overview of the autonomous…

几种常见软件过程模型的比较

瀑布模型 瀑布模型&#xff08;经典生命周期&#xff09;提出了软件开发的系统化的、顺序的方法。其流 程从用户需求规格说明开始&#xff0c;通过策划、建模、构建和部署的过程&#xff0c;最终提供一 个完整的软件并提供持续的技术支持。 优点&#xff1a; 1. 强调开发的…

两篇基于语义地图的视觉定位方案:AVP-SLAM和RoadMap

本文介绍两篇使用语义地图进行视觉定位的论文&#xff0c;两篇论文工程性很强&#xff0c;值得一学。 AVP-SLAM是一篇关于自动泊车的视觉定位方案&#xff0c;收录于 IROS 2020。论文链接为&#xff1a;https://arxiv.org/abs/2007.01813&#xff0c;视频链接为&#xff1a;ht…

【51Nod - 1270】数组的最大代价(dp,思维)

题干&#xff1a; 数组A包含N个元素A1, A2......AN。数组B包含N个元素B1, B2......BN。并且数组A中的每一个元素Ai&#xff0c;都满足1 < Ai < Bi。数组A的代价定义如下&#xff1a; &#xff08;公式表示所有两个相邻元素的差的绝对值之和&#xff09; 给出数组B&…