KITTI自动驾驶数据集可视化教程

在这里插入图片描述
本文介绍关于自动驾驶数据集KITTI的基本操作,包括CameraLiDAR可视化教程,源码已上传:https://download.csdn.net/download/cg129054036/20907604


1. 数据准备

KITTI 数据 (calib, image_2, label_2, velodyne) 添加到 dataset/KITTI/object/training文件夹下。
目录文件结构如下:

├── dataset
│   ├── KITTI
│   │   ├── object
│   │   │   ├──KITTI
│   │   │      ├──ImageSets
│   │   │   ├──training
│   │   │      ├──calib & velodyne & label_2 & image_2 
├── kitti_object.py
├── kitti_test.py
├── kitti_util.py
├── viz_util.py

2. Requirements

为了显示物体 2D bbox3D bboxUbuntu系统需要安装以下工具:

  • mayavi
  • pillow
  • vtk
  • opencv
  • PIL
  • matplotlib
  • numpy

3. 可视化操作

下面依次展示 KITTI 数据集可视化结果,可视化操作代码存放在 kitti_test.py 文件中,这里通过设置 data_idx=10 来展示编号为000010的数据,共有9种可视化操作,依次为:

  • 图片显示
  • 图片上绘制2D bbox
  • 图片上绘制3D bbox
  • Lidar在图片上投影
  • LidarFOV图
  • Lidar三维可视化
  • Lidar绘制3D bbox
  • Lidar鸟瞰图
  • Lidar鸟瞰图绘制2D bbox

代码中dataset需要修改为数据集实际路径

def visualization():import mayavi.mlab as mlabdataset = kitti_object(os.path.join(ROOT_DIR, '../dataset/KITTI/object')) # determine data_idxdata_idx = 10# Load data from datasetobjects = dataset.get_label_objects(data_idx) print("There are %d objects.", len(objects))img = dataset.get_image(data_idx)             img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)img_height, img_width, img_channel = img.shape pc_velo = dataset.get_lidar(data_idx)[:,0:3]  calib = dataset.get_calibration(data_idx)   

(1) 图片显示

Image.fromarray(img).show()

在这里插入图片描述
(2) 图片上绘制2D bbox

这里KITTI 数据集给出了目标在图片上的坐标位置 (Xmin, Ymin, Xmax, Ymax),直接绘图即可。

show_image_with_boxes(img, objects, calib, False)

在这里插入图片描述
(3) 图片上绘制3D bbox

绘制物体 3D bbox时,需要进行坐标系转换,KITTI 数据集中给出的是物体在相机坐标系的位置 (x,y,z),根据物体 bbox 尺寸(h,w,l) 首先计算 3D bbox 8个顶点坐标,然后借助标定文件将其转换为图片坐标系坐标 (u, v)

show_image_with_boxes(img, objects, calib, True)

在这里插入图片描述
(4) Lidar在图片上投影

Lidar 坐标下各 point 坐标转换为图片坐标系下坐标,然后根据图片尺寸选取投影点。

show_lidar_on_image(pc_velo, img, calib, img_width, img_height)

在这里插入图片描述
(5) LidarFOV图

imgfov_pc_velo, pts_2d, fov_inds = get_lidar_in_image_fov(pc_velo, calib, 0, 0, img_width, img_height, True)
draw_lidar(imgfov_pc_velo, show=True)

在这里插入图片描述
(6) Lidar三维可视化

 draw_lidar(pc_velo, show=True)

在这里插入图片描述
(7) Lidar绘制3D bbox

绘制Lidar3D bbox时,需要进行坐标系转换,KITTI 数据集中给出的是物体在相机坐标系的位置(x,y,z),这里借助标定文件将其转换为Lidar坐标系下位置,同时借助物体bbox 尺寸(h,w,l)计算3D框8个顶点坐标。

show_lidar_with_boxes(pc_velo, objects, calib,  True, img_width, img_height)

在这里插入图片描述
(8) Lidar鸟瞰图

鸟瞰图绘制时将点云数据进行了预处理,只选取 x 坐标位于[0,70.4],y坐标位于[-40,40]的有效点。

show_lidar_topview(pc_velo, objects, calib)

在这里插入图片描述
(9) Lidar鸟瞰图绘制2D bbox

绘制时为了区分物体距激光雷达距离,将30米内目标使用绿色标志30米-50米内目标使用红色标志50米以外目标使用蓝色标志(场景0000010无此距离目标。)

img1 = cv2.imread('000010_BEV.png')
img = cv2.cvtColor(img1, cv2.COLOR_BGR2RGB)
show_lidar_topview_with_boxes(img1, objects, calib)

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/439603.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

重读经典《Quaternion kinematics for the error-state Kalman filter》

本文将介绍一篇关于 四元数运动学的误差卡尔曼滤波 经典论文。本文结构如下: 第1章四元数定义和性质介绍,包括:加法、减法、乘法(矩阵表示)、模、幂数、指数运算等。第2章旋转群定义和性质介绍,包括&#…

【CodeForces - 789C】Functions again(最大子段和变形,dp,思维)

题干: Something happened in Uzhlyandia again... There are riots on the streets... Famous Uzhlyandian superheroes Shean the Sheep and Stas the Giraffe were called in order to save the situation. Upon the arriving, they found that citizens are wo…

一步步编写操作系统 55 CPL和DPL入门2

接上节。 图中第132行的jmp指令,段选择子为SELECTOR_CODE,其RPL的值为RPL0,RPL0定义在include/boot.inc中,其值为0。选择子的索引部分值为1,表示对应GDT中第1个段描述符,该描述符的DPL为0,&…

详解停车位检测算法 Vision-Based Parking-Slot Detection: A DCNN-Based Approach and a Large-Scale Benchmark

本文介绍一篇基于深度学习的停车位检测论文:DeepPS,作者同时公开了数据集ps2.0,工作很扎实,对于入门停车位检测很有帮助,论文发表在 IEEE T-IP 2018。 项目链接为:https://cslinzhang.github.io/deepps/ 0…

Monitor(管程)是什么意思?Java中Monitor(管程)的介绍

本篇文章给大家带来的内容是关于Monitor(管程)是什么意思?Java中Monitor(管程)的介绍,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 monitor的概念 管程&#x…

详解经典GPS辅助惯性导航论文 A GPS-aided Inertial Navigation System in Direct Configuration

本文介绍一篇 IMU 和 GPS 融合的惯性导航论文,重点是理解本文提出的:Dynamical constraints update、Roll and pitch updates 和 Position and heading updates。 论文链接为:https://www.sciencedirect.com/science/article/pii/S166564231…

详解停车位检测论文:Attentional Graph Neural Network for Parking-slot Detection

本文介绍一篇注意力图神经网络用于停车位检测论文,论文已收录于 RA-L2021。在之前的基于卷积神经网络的停车位检测方法中,很少考虑停车位标记点之间的关联信息,从而导致需要复杂的后处理。在本文中,作者将环视图中的标记点看作图结…

详解3D物体检测模型 SPG: Unsupervised Domain Adaptation for 3D Object Detection via Semantic Point Generation

本文对基于激光雷达的无监督域自适应3D物体检测进行了研究,论文已收录于 ICCV2021。 在Waymo Domain Adaptation dataset上,作者发现点云质量的下降是3D物件检测器性能下降的主要原因。因此论文提出了Semantic Point Generation (SPG)方法,首…

Waymo研发经理:《自动驾驶感知前沿技术介绍》

Waymo研发经理|自动驾驶感知前沿技术介绍这是Waymo研发经理(VoxelNet作者)的一个最新分享报告:《自动驾驶感知前沿技术介绍》。在这份报告里,介绍了Waymo在自动驾驶感知中五个研究方向的最新成果。 1. Overview of the autonomous…

几种常见软件过程模型的比较

瀑布模型 瀑布模型(经典生命周期)提出了软件开发的系统化的、顺序的方法。其流 程从用户需求规格说明开始,通过策划、建模、构建和部署的过程,最终提供一 个完整的软件并提供持续的技术支持。 优点: 1. 强调开发的…

两篇基于语义地图的视觉定位方案:AVP-SLAM和RoadMap

本文介绍两篇使用语义地图进行视觉定位的论文,两篇论文工程性很强,值得一学。 AVP-SLAM是一篇关于自动泊车的视觉定位方案,收录于 IROS 2020。论文链接为:https://arxiv.org/abs/2007.01813,视频链接为:ht…

【51Nod - 1270】数组的最大代价(dp,思维)

题干&#xff1a; 数组A包含N个元素A1, A2......AN。数组B包含N个元素B1, B2......BN。并且数组A中的每一个元素Ai&#xff0c;都满足1 < Ai < Bi。数组A的代价定义如下&#xff1a; &#xff08;公式表示所有两个相邻元素的差的绝对值之和&#xff09; 给出数组B&…

一步步编写操作系统 56 门、调用门与RPL序 1

小弟多次想把调用门和RPL分开单独说&#xff0c;但几次尝试都没有成功&#xff0c;我发现它们之间是紧偶合、密不可分&#xff0c;RPL的产生主要是为解决系统调用时的“越权”问题&#xff0c;系统调用的实现方式中&#xff0c;以调用门和中断门最为适合。由于以后我们将用中断…

自动驾驶纯视觉3D物体检测算法

视频链接&#xff1a;https://www.shenlanxueyuan.com/open/course/112 这是Pseudo-LiDAR作者最近做的一个分享报告&#xff1a;《Pseudo-LiDAR&#xff1a;基于相机的3D物体检测算法》。在这份报告里&#xff0c;作者主要介绍了博士期间的研究成果&#xff1a;基于深度学习的…

一步步编写操作系统 57 门、调用门与RPL序 2

接上文&#xff1a; 提供了4种门的原因是&#xff0c;它们都有各自的应用环境&#xff0c;但它们都是用来实现从低特权级的代码段转向高特权级的代码段&#xff0c;咱们这里也只讨论有关特权级的功用&#xff1a; 1.调用门 call和jmp指令后接调用门选择子为参数&#xff0c;以…

Coursera自动驾驶课程第15讲:GNSS and INS Sensing for Pose Estimation

在上一讲《Coursera自动驾驶课程第14讲&#xff1a;Linear and Nonlinear Kalman Filters》 我们学习了卡尔曼滤波相关知识&#xff0c;包括&#xff1a;线性卡尔曼滤波&#xff08;KF&#xff09;、扩展卡尔曼滤波&#xff08;EKF&#xff09;、误差卡尔曼滤波&#xff08;ES-…

详解车道线检测数据集和模型 VIL-100: A New Dataset and A Baseline Model for Video Instance Lane Detection

本文介绍一个新的车道线数据集 VIL-100 和检测模型 MMA-Net&#xff0c;论文已收录于 ICCV2021&#xff0c;重点是理解本文提出的 LGMA 模块&#xff0c;用于聚合局部和全局记忆特征。 论文链接&#xff1a;https://arxiv.org/abs/2108.08482 项目链接&#xff1a;https://gi…

七天入门图像分割(1):图像分割综述

最近在研究自动驾驶视觉语义地图构建&#xff0c;因为要使用到语义分割技术&#xff0c;趁此机会学习了百度飞桨的图像分割课程&#xff0c;课程蛮好的&#xff0c;收获也蛮大的。 课程地址&#xff1a;https://aistudio.baidu.com/aistudio/course/introduce/1767 1. 课程简要…

一步步编写操作系统 59 cpu的IO特权级1

在保护模式下&#xff0c;处理器中的“阶级”不仅体现在数据和代码的访问&#xff0c;还体现在指令中。 一方面将指令分级的原因是&#xff0c;有些指令的执行对计算机有着严重的影响&#xff0c;它们只有在0特权级下被执行&#xff0c;因此被称为特权指令&#xff08;Privile…

重读经典:《ImageNet Classification with Deep Convolutional Neural Networks》

9年后重读深度学习奠基作之一&#xff1a;AlexNet【下】【论文精读】这两天偶然间在B站看了李沐博士对AlexNet论文的重新解读&#xff0c;收获满满。AlexNet是当今深度学习浪潮奠基作之一&#xff0c;发表在2012年。在视频中&#xff0c;李沐博士主要是分享了他的三步法快速读论…