从零实现一个3D目标检测算法(1):3D目标检测概述

在这里插入图片描述
本文是根据github上的开源项目:https://github.com/open-mmlab/OpenPCDet整理而来,在此表示感谢,强烈推荐大家去关注。使用的预训练模型也为此项目中提供的模型,不过此项目已更新为v0.2版,与本文中代码略有不同。

本文实现的3D目标检测算法是PointPillars,论文地址为:https://arxiv.org/abs/1812.05784,使用的激光雷达点云数据是KITTI数据(http://www.cvlibs.net/datasets/kitti/eval_object.php?obj_benchmark=3d)。


文章目录

    • 1. 3D目标检测
      • 1.1 3D目标检测研究现状
      • 1.2 点云3D目标检测开源库
    • 2. PointPillars网络及工程概述
      • 2.1 PointPillars工作原理
      • 2.2 PointPillar工程

1. 3D目标检测

在开始写代码实现PointPillars检测算法之前,我想先介绍一些关于点云3D目标检测的背景知识。大家有时间的话可以看看下面这个报告,是OpenPCDet项目作者此前分享的报告(https://www.bilibili.com/video/av89811975?zw)。

(2021-04-11日补充):点云3D目标检测算法库OpenPCDet解析与开发实践(Video)

基于点云场景的三维物体检测算法及应用


(2021-1-27日补充):这是PointNet作者2021年分享的报告《3D物体检测发展与未来》,对3D物体检测感兴趣的朋友可以看看,PointNet作者对PointPillars算法进行了解读。

【PointNet作者亲述】90分钟带你了解3D物体检测算法和未来方向!


1.1 3D目标检测研究现状

毋庸置疑,在自动驾驶或辅助机器人等应用中,3D目标检测现在变得越来越重要。在这当中,激光雷达(LiDAR)是使用最为广泛的3D传感器,LiDAR可以生成稀疏,不规则的点云数据

关于3D目标检测,根据点云表示方法大致可以分为两类:the grid-based methodsthe point-based methods。下面简要介绍这两种方法:

3D Object Detection with Grid-based Methods:由于点云是不规则的,之前的学者通常会对点云进行投影或栅格化处理,转换成规则的grid数据格式,然后再使用2D或3DCNN处理。

  • MV3D(https://arxiv.org/abs/1611.07759)将点云投影到鸟瞰图或前视图上进行处理,然后使用多个预定义的3D anchors来生成3D bounding boxes
  • 除了将点云投影到鸟瞰图上,还可以将点云直接转换为3D Voxels格式,然后使用3DCNN来检测,这其中的代表论文有VoxelNet(https://arxiv.org/abs/1711.06396),Second(https://www.mdpi.com/1424-8220/18/10/3337)。
MV3DVoxelNetSecond
在这里插入图片描述在这里插入图片描述在这里插入图片描述
以上方法虽然能够高效的生成3D候选方案,但是其目标检测感受野往往是有限的,点云在转换成grid时,不可避免的会出现信息丢失的情况。

3D Object Detection with Point-based Methods:基于Point的方法大多数都是使用PointNet(https://arxiv.org/abs/1612.00593)网络进行点云特征学习,这使得网络能有更灵活的感受野进行点云特征学习,同时也保留了点云的原始数据信息。

这其中的代表论文是PointRCNN(https://arxiv.org/abs/1812.04244),这是一个两阶段的目标检测方案,第一阶段通过PointNet++网络将点云分为前景点和背景点,然后对每一个前景点生成一个候选方案,第二阶段对前景点及其候选方案进行进一步优化,生成最终的bounding box

PointNetPointRCNN
在这里插入图片描述在这里插入图片描述

1.2 点云3D目标检测开源库

这里引用PCDet作者之前分享的文章(https://zhuanlan.zhihu.com/p/152120636)。PCDet 3D目标检测框架的整体结构设计与优势为:

数据—模型分离的顶层代码框架设计思想

与图像处理所不同,不同点云数据集中3D坐标定义与转换往往使研究者很是迷糊。因此,PCDet定义了统一的规范化3D坐标表示贯穿整个数据处理与模型计算,从而将数据模块模型处理模块完全分离,其优势体现在:

  • 研究者在研发不同结构模型时,使用统一标准化的3D坐标系进行各种相关处理(比如计算lossRoI Pooling和模型后处理等),而无需理会不同数据集的坐标规定差异性;
  • 研究者在添加新数据集时,只需写少量代码将原始数据转化到标准化坐标定义下,PCDet将自动进行数据增强并适配到各种模型中。

PCDet数据—模型分离的顶层设计,使得研究者可以轻松适配各种模型到不同的点云3D目标检测数据集上,免去研发模型时迷失在3D坐标转换中的顾虑。

在这里插入图片描述统一的3D目标检测坐标定义
不同的点云数据集在坐标系以及3D框的定义上往往不一样(KITTI数据集中的cameraLiDAR两个坐标系经常让人混乱),因此在 PCDet 中采用了固定的统一点云坐标系,以及更规范的3D检测框定义,贯穿整个数据增强、处理、模型计算以及检测后处理过程。3D检测框的7维信息定义如下:

3D bounding box: (x, y, z, dx, dy, dz, heading)

其中,(x, y, z) 为物体3D框的几何中心位置,(dx, dy, dz)分别为物体3D框在heading角度为0时沿着x-y-z三个方向的长度,heading为物体在俯视图下的朝向角 (沿着x轴方向为0度角,逆时针x到y角度增加)。

基于 PCDet 所采用的标准化3D框定义,再也不用纠结到底是物体3D中心还是物体底部中心;再也不用纠结物体三维尺寸到底是l-w-h排列还是w-l-h排列;再也不用纠结heading 0度角到底是哪,到底是顺时针增加还是逆时针增加。

灵活全面的模块化模型拓扑设计
基于下图所示的灵活且全面的模块化设计,在PCDet中搭建3D目标检测框架只需要写config文件将所需模块定义清楚,然后PCDet将自动根据模块间的拓扑顺序组合为3D目标检测框架,来进行训练和测试。

在这里插入图片描述PCDet可以支持目前已有的绝大多数面向LiDAR点云的3D目标检测算法,包括voxel-basedpoint-basedpoint-voxel hybrid以及one-stage/two-stage等等3D目标检测算法。

在这里插入图片描述


2. PointPillars网络及工程概述

2.1 PointPillars工作原理

现在不妨先了解一下PointPillars是如何工作的。PointPillars整体思路是将3维的点云转成2维的伪图像,然后使用二维卷积网络进行端到端的目标检测,网络结构如下图所示。
在这里插入图片描述下面分别介绍PointPillars的三个子网络部分:

(1)Pillar Feature Net
Feature Net主要是负责把点云数据处理成类似图像的数据。首先可以将x-y平面投影为一个大小为h x w的网格。每一个小网格表示为一个Pillar,这样就划分出h x wPillar

原始的点云数据有(x,y,z,r)4个维度,r代表点云反射率,论文中将其扩展为9个维度(x, y, z, r, x_c, y_c, z_c, x_p, y_p),带c下标的是柱子中的点相对于柱子中心的偏移位置坐标,带p下标的是点相对于整个大网格中心的全局偏移位置坐标。于是就形成了维度为(D, P, N)的张量, 其中D=9(不过PCDet实现与论文稍有不同,PCDet扩展成D=10), N为每个Pillar的采样点数,P为非空的Pillar数目。

然后就是学习点云特征,用一个简化的PointNetD维中学出C个channel来得到一个(C, P, N)的张量。在这个维度上做max pooling operation,得到(C, P)的张量.最后得到(C,H,W)的伪图像.

(2)Backbone

包含两个子网络,一个是自上而下的下采样网络,另一个是上采样网络,具体网络结构可以看本文2.2节。

(3)Detection

检测头使用的是SSD的检测头,关于SSD算法细节可以参考《动手学深度学习》这本书(http://zh.d2l.ai/chapter_computer-vision/ssd.html)。
PointPillars工作原理就介绍这么多,下面将介绍PointPillar工程的整体结构。


2.2 PointPillar工程

参考PCDet,PointPillars各文件组织方式如下,这里暂时只需要对整个工程有个整体印象,后面将逐步完成各文件中的代码:

PCDet
├── data
│   ├── velodyne      
│   │   │──000010.bin        
├── doc
├── output
├── pcdet
│   ├── config.py
│   ├── datasets
│   │   ├── dataset.py
│   │   ├── __init__.py
│   │   ├── kitti
│   │   │   ├── kitti_dataset.py
│   │   │   └── __pycache__
│   │   │       └── kitti_dataset.cpython-36.pyc
│   │   └── __pycache__
│   │       ├── dataset.cpython-36.pyc
│   │       └── __init__.cpython-36.pyc
│   ├── models
│   │   ├── bbox_heads
│   │   │   ├── anchor_target_assigner.py
│   │   │   ├── __pycache__
│   │   │   │   ├── anchor_target_assigner.cpython-36.pyc
│   │   │   │   └── rpn_head.cpython-36.pyc
│   │   │   └── rpn_head.py
│   │   ├── detectors
│   │   │   ├── detector3d.py
│   │   │   ├── __init__.py
│   │   │   ├── pointpillar.py
│   │   │   └── __pycache__
│   │   │       ├── detector3d.cpython-36.pyc
│   │   │       ├── __init__.cpython-36.pyc
│   │   │       └── pointpillar.cpython-36.pyc
│   │   ├── __init__.py
│   │   ├── model_utils
│   │   │   ├── __init__.py
│   │   │   ├── __pycache__
│   │   │   │   ├── __init__.cpython-36.pyc
│   │   │   │   └── pytorch_utils.cpython-36.pyc
│   │   │   └── pytorch_utils.py
│   │   ├── __pycache__
│   │   │   └── __init__.cpython-36.pyc
│   │   ├── rpn
│   │   │   ├── pillar_scatter.py
│   │   │   └── __pycache__
│   │   │       └── pillar_scatter.cpython-36.pyc
│   │   └── vfe
│   │       ├── __init__.py
│   │       ├── __pycache__
│   │       │   ├── __init__.cpython-36.pyc
│   │       │   └── vfe_utils.cpython-36.pyc
│   │       └── vfe_utils.py
│   ├── ops
│   │   ├── iou3d_nms
│   │   │   ├── build
│   │   │   │   ├── lib.linux-x86_64-3.6
│   │   │   │   │   └── iou3d_nms_cuda.cpython-36m-x86_64-linux-gnu.so
│   │   │   │   └── temp.linux-x86_64-3.6
│   │   │   │       └── src
│   │   │   │           ├── iou3d_nms_kernel.o
│   │   │   │           └── iou3d_nms.o
│   │   │   ├── iou3d_nms_cuda.cpython-36m-x86_64-linux-gnu.so
│   │   │   ├── iou3d_nms.egg-info
│   │   │   │   ├── dependency_links.txt
│   │   │   │   ├── PKG-INFO
│   │   │   │   ├── SOURCES.txt
│   │   │   │   └── top_level.txt
│   │   │   ├── iou3d_nms_utils.py
│   │   │   ├── __pycache__
│   │   │   │   └── iou3d_nms_utils.cpython-36.pyc
│   │   │   ├── setup.py
│   │   │   └── src
│   │   │       ├── iou3d_nms.cpp
│   │   │       └── iou3d_nms_kernel.cu
│   │   └── roiaware_pool3d
│   │       ├── build
│   │       │   ├── lib.linux-x86_64-3.6
│   │       │   │   └── roiaware_pool3d_cuda.cpython-36m-x86_64-linux-gnu.so
│   │       │   └── temp.linux-x86_64-3.6
│   │       │       └── src
│   │       │           ├── roiaware_pool3d_kernel.o
│   │       │           └── roiaware_pool3d.o
│   │       ├── __pycache__
│   │       │   └── roiaware_pool3d_utils.cpython-36.pyc
│   │       ├── roiaware_pool3d_cuda.cpython-36m-x86_64-linux-gnu.so
│   │       ├── roiaware_pool3d.egg-info
│   │       │   ├── dependency_links.txt
│   │       │   ├── PKG-INFO
│   │       │   ├── SOURCES.txt
│   │       │   └── top_level.txt
│   │       ├── roiaware_pool3d_utils.py
│   │       ├── setup.py
│   │       └── src
│   │           ├── roiaware_pool3d.cpp
│   │           └── roiaware_pool3d_kernel.cu
│   ├── __pycache__
│   │   └── config.cpython-36.pyc
│   └── utils
│       ├── box_coder_utils.py
│       ├── box_utils.py
│       ├── common_utils.py
│       └── __pycache__
│           ├── box_coder_utils.cpython-36.pyc
│           ├── box_utils.cpython-36.pyc
│           └── common_utils.cpython-36.pyc
└── tools├── pointpillar.pth├── pointpillar.yaml├── test.py└── test.sh

下面给出PointPillars的网络结构,主要由3部分组成,网路结构相对也是比较简单的,这可能也是PointPillars为何是KITTI数据集上运算速度最快的原因。
在这里插入图片描述

下面是网络的具体结构:

PointPillar((vfe): PillarFeatureNetOld2((pfn_layers): ModuleList((0): PFNLayer((linear): Linear(in_features=10, out_features=64, bias=False)(norm): BatchNorm1d(64, eps=0.001, momentum=0.01, affine=True, track_running_stats=True))))(rpn_net): PointPillarsScatter()(rpn_head): RPNV2((blocks): ModuleList((0): Sequential((0): ZeroPad2d(padding=(1, 1, 1, 1), value=0.0)(1): Conv2d(64, 64, kernel_size=(3, 3), stride=(2, 2), bias=False)(2): BatchNorm2d(64, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(3): ReLU()(4): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(5): BatchNorm2d(64, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(6): ReLU()(7): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(8): BatchNorm2d(64, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(9): ReLU()(10): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(11): BatchNorm2d(64, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(12): ReLU())(1): Sequential((0): ZeroPad2d(padding=(1, 1, 1, 1), value=0.0)(1): Conv2d(64, 128, kernel_size=(3, 3), stride=(2, 2), bias=False)(2): BatchNorm2d(128, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(3): ReLU()(4): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(5): BatchNorm2d(128, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(6): ReLU()(7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(8): BatchNorm2d(128, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(9): ReLU()(10): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(11): BatchNorm2d(128, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(12): ReLU()(13): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(14): BatchNorm2d(128, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(15): ReLU()(16): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(17): BatchNorm2d(128, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(18): ReLU())(2): Sequential((0): ZeroPad2d(padding=(1, 1, 1, 1), value=0.0)(1): Conv2d(128, 256, kernel_size=(3, 3), stride=(2, 2), bias=False)(2): BatchNorm2d(256, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(3): ReLU()(4): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(5): BatchNorm2d(256, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(6): ReLU()(7): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(8): BatchNorm2d(256, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(9): ReLU()(10): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(11): BatchNorm2d(256, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(12): ReLU()(13): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(14): BatchNorm2d(256, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(15): ReLU()(16): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(17): BatchNorm2d(256, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(18): ReLU()))(deblocks): ModuleList((0): Sequential((0): ConvTranspose2d(64, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)(1): BatchNorm2d(128, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(2): ReLU())(1): Sequential((0): ConvTranspose2d(128, 128, kernel_size=(2, 2), stride=(2, 2), bias=False)(1): BatchNorm2d(128, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(2): ReLU())(2): Sequential((0): ConvTranspose2d(256, 128, kernel_size=(4, 4), stride=(4, 4), bias=False)(1): BatchNorm2d(128, eps=0.001, momentum=0.01, affine=True, track_running_stats=True)(2): ReLU()))(conv_cls): Conv2d(384, 18, kernel_size=(1, 1), stride=(1, 1))(conv_box): Conv2d(384, 42, kernel_size=(1, 1), stride=(1, 1))(conv_dir_cls): Conv2d(384, 12, kernel_size=(1, 1), stride=(1, 1)))
)

最后,我们看一下PointPillar.yaml配置文件,配置文件存储着网络具体参数,以及训练和测试参数,这在后面的代码编写时会多次用到:

CLASS_NAMES: ['Car', 'Pedestrian', 'Cyclist']DATA_CONFIG:DATASET: 'KittiDataset'DATA_DIR: 'data'FOV_POINTS_ONLY: TrueNUM_POINT_FEATURES: {'total': 4,'use': 4}POINT_CLOUD_RANGE: [0, -39.68, -3, 69.12, 39.68, 1]MASK_POINTS_BY_RANGE: TrueTRAIN:INFO_PATH: [data/kitti_infos_train.pkl]SHUFFLE_POINTS: TrueMAX_NUMBER_OF_VOXELS: 16000TEST:INFO_PATH: [data/kitti_infos_val.pkl]SHUFFLE_POINTS: FalseMAX_NUMBER_OF_VOXELS: 40000            AUGMENTATION:NOISE_PER_OBJECT:ENABLED: TrueGT_LOC_NOISE_STD: [1.0, 1.0, 0.1]GT_ROT_UNIFORM_NOISE: [-0.78539816, 0.78539816]NOISE_GLOBAL_SCENE:ENABLED: TrueGLOBAL_ROT_UNIFORM_NOISE: [-0.78539816, 0.78539816]GLOBAL_SCALING_UNIFORM_NOISE: [0.95, 1.05]DB_SAMPLER:ENABLED: TrueDB_INFO_PATH: [data/kitti/kitti_dbinfos_train.pkl]PREPARE:filter_by_difficulty: [-1]filter_by_min_points: ['Car:5', 'Pedestrian:5', 'Cyclist:5']RATE: 1.0SAMPLE_GROUPS: ['Car:15','Pedestrian:10', 'Cyclist:10']USE_ROAD_PLANE: TrueVOXEL_GENERATOR:MAX_POINTS_PER_VOXEL: 32   VOXEL_SIZE: [0.16, 0.16, 4] MODEL:NAME: PointPillar VFE:NAME: PillarFeatureNetOld2ARGS: {'use_norm': True,'num_filters': [64],'with_distance': False,}RPN:PARAMS_FIXED: False  # DO NOT USE THISBACKBONE:NAME: PointPillarsScatterARGS: {}RPN_HEAD:NAME: RPNV2DOWNSAMPLE_FACTOR: 8ARGS: {'use_norm': True,'concat_input': False,'num_input_features': 64,'layer_nums': [3, 5, 5],'layer_strides': [2, 2, 2],'num_filters': [64, 128, 256], 'upsample_strides': [1, 2, 4],'num_upsample_filters': [128, 128, 128],'encode_background_as_zeros': True,'use_direction_classifier': True,'num_direction_bins': 2,'dir_offset': 0.78539,      'dir_limit_offset': 0.0,'use_binary_dir_classifier': False}TARGET_CONFIG:DOWNSAMPLED_FACTOR: 2 BOX_CODER: ResidualCoderREGION_SIMILARITY_FN: nearest_iou_similaritySAMPLE_POS_FRACTION: -1.0SAMPLE_SIZE: 512         ANCHOR_GENERATOR: [{'anchor_range': [0, -40.0, -1.78, 70.4, 40.0, -1.78], 'sizes': [[1.6, 3.9, 1.56]],'rotations': [0, 1.57],'matched_threshold': 0.6,'unmatched_threshold': 0.45,'class_name': 'Car'},{'anchor_range': [0, -40, -0.6, 70.4, 40, -0.6],'sizes': [[0.6, 0.8, 1.73]],'rotations': [0, 1.57],'matched_threshold': 0.5,'unmatched_threshold': 0.35,'class_name': 'Pedestrian'},{'anchor_range': [0, -40, -0.6, 70.4, 40, -0.6],'sizes': [[0.6, 1.76, 1.73]],'rotations': [0, 1.57],'matched_threshold': 0.5,'unmatched_threshold': 0.35,'class_name': 'Cyclist'},]RCNN:ENABLED: FalseLOSSES:RPN_REG_LOSS: smooth-l1LOSS_WEIGHTS: {'rpn_cls_weight': 1.0,'rpn_loc_weight': 2.0,'rpn_dir_weight': 0.2,'code_weights': [1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0]}TRAIN:SPLIT: trainOPTIMIZATION:OPTIMIZER: adam_onecycleLR: 0.003WEIGHT_DECAY: 0.01MOMENTUM: 0.9MOMS: [0.95, 0.85]PCT_START: 0.4DIV_FACTOR: 10DECAY_STEP_LIST: [35, 45]LR_DECAY: 0.1LR_CLIP: 0.0000001LR_WARMUP: FalseWARMUP_EPOCH: 1GRAD_NORM_CLIP: 10TEST:SPLIT: valNMS_TYPE: nms_gpuMULTI_CLASSES_NMS: FalseNMS_THRESH: 0.01SCORE_THRESH: 0.1       USE_RAW_SCORE: True      NMS_PRE_MAXSIZE_LAST: 4096NMS_POST_MAXSIZE_LAST: 500RECALL_THRESH_LIST: [0.5, 0.7]EVAL_METRIC: kittiBOX_FILTER: {'USE_IMAGE_AREA_FILTER': True,'LIMIT_RANGE': [0, -40, -3.0, 70.4, 40, 3.0]}

我们也可以看看本工程的代码量,总共有2280行代码,其中对于CUDAC++部分,我们使用PCDet工程中提供的代码,将重点放在Python代码的编写部分。

-------------------------------------------------------------------------------
Language                     files          blank        comment           code
-------------------------------------------------------------------------------
Python                          22            399            875           1183
CUDA                             2            156             72            525
C++                              2             92             47            226
Markdown                         1             34              0            199
YAML                             1             26              0            146
Bourne Shell                     1              0              0              1
-------------------------------------------------------------------------------
SUM:                            29            707            994           2280
-------------------------------------------------------------------------------

总结:本文首先对3D目标检测研究现状进行了概述,然后介绍了PCDet3D目标检测库,最后对要实现的PointPillars工作原理及其工程进行了介绍。在下一篇文章中我们将开始从头编写代码,一步一步实现3D检测模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/439706.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一步步编写操作系统 45 用c语言编写内核2

在linux下用于链接的程序是ld,链接有一个好处,可以指定最终生成的可执行文件的起始虚拟地址。它是用-Ttext参数来指定的,所以咱们可以执行以下命令完成链接: ld kernel/main.o -Ttext 0xc0001500 -e main -o kernel/kernel.bin …

使用OpenCV库快速求解相机内参

本文主要介绍如何使用OpenCV库函数求解相机内参。具体可查阅官网:https://docs.opencv.org/master/dc/dbb/tutorial_py_calibration.html。 关于相机内参的求解还有很多其它的工具,如使用MATLAB求解会更方便,直接调用MATLAB中的APP即可。 1.背…

一步步编写操作系统 46 用c语言编写内核3

再把上节代码贴出来, 1 //int main(void) { 2 int _start(void) { 3 while(1); 4 return 0; 5 }有没有同学想过,这里写一个_start函数,让其调用main函数如何?其实这是可以的,main函数并不是第一个函数,它实…

一步步编写操作系统 47 48 二进制程序运行方式

操作系统并不是在功能上给予用户的支持,这种支持是体现在机制上。也就是说,单纯的操作系统,用户拿它什么都做不了,用户需要的是某种功能。而操作系统仅仅是个提供支持的平台。 虽然我们是模仿linux来写一个黑屏白字的系统&#x…

百度顶会论文复现(1):课程概述

最近百度推出了一款重磅课程《全球顶会论文作者,28天免费手把手带你复现顶会论文》。这个课程真的是很硬核的课程,这里简单记录下自己的学习过程。 文章目录1. 课程设计思路和安排2. 课程大纲1. 课程设计思路和安排 课程设计思路如下,共分为…

百度顶会论文复现(2):GAN综述

本节课主要是对GAN的发展进行了介绍,包括基本原理,训练方法,存在问题,改进以及应用场景等。实践作业则为手写数字生成。课程地址为:https://aistudio.baidu.com/aistudio/education/preview/493290。 文章目录1.什么是…

一步步编写操作系统 48 二进制程序的加载方式

接上节,程序头可以自定义,只要我们按照自己定义的格式去解析就行。也许我光这么一说,很多同学还是不能彻底明白如何自定义文件头,因为大多数同学都是用高级语言来写程序,即使用了偏底层的c语言,不同平台的c…

百度顶会论文复现(3):视频分类综述

本节课主要是对视频分类的发展进行了介绍,包括任务与背景,分类方法,前沿进展等。课程地址为:https://aistudio.baidu.com/aistudio/course/introduce/1340?directly1&shared1。 文章目录1. 任务与背景2. 视频分类方法2.1 双流…

一步步编写操作系统 46 linux的elf可执行文件格式1

ELF文件格式依然是分为文件头和文件体两部分,只是该文件头相对稍显复杂,类似层次化结构,先用个ELF header从“全局上”给出程序文件的组织结构,概要出程序中其它头表的位置大小等信息,如程序头表的大小及位置、节头表的…

百度顶会论文复现(4):飞桨API详解

本节课主要是对飞桨常用API进行了介绍,课程地址为:https://aistudio.baidu.com/aistudio/education/group/info/1340。 文章目录1.飞桨API官网2. API使用介绍3. 飞桨模型操作1.飞桨API官网 官网地址为:https://www.paddlepaddle.org.cn/docu…

一步步编写操作系统 47 elf格式文件分析实验

在上一节中,我们讲述了elf格式的部分理论知识,为什么是部分呢?因为我们本着“够用”的原则,只把我们需要了解的部分说完啦。不过,我相信大部分同学仅仅凭上一节中的理论知识还是领悟不到elf本质,咱们在本节…

百度飞桨顶会论文复现(5):视频分类论文之《Representation Flow for Action Recognition》篇

这次老师在课上总共领读了4篇分类论文,我这里分享其中的一篇论文,是关于使用神经网络对光流进行学习。 课程地址是:https://aistudio.baidu.com/aistudio/education/group/info/1340。 论文地址是:https://arxiv.org/abs/1810.014…

智能算法(GA、DBO等)求解零等待流水车间调度问题(NWFSP)

先做一个声明:文章是由我的个人公众号中的推送直接复制粘贴而来,因此对智能优化算法感兴趣的朋友,可关注我的个人公众号:启发式算法讨论。我会不定期在公众号里分享不同的智能优化算法,经典的,或者是近几年…

一步步编写操作系统 50 加载内核3

接上节,在这里,我们把参数放到了栈中保存,大家注意到了,参数入栈的顺序是先从最右边的开始,最后压入的参数最左边的,其实这是某种约定,要不,为什么不先把中间的参数src入栈呢。既然主…

动手学无人驾驶(5):多传感器数据融合

本系列的前4篇文章主要介绍了深度学习技术在无人驾驶环境感知中的应用,包括交通标志识别,图像与点云3D目标检测。关于环境感知部分的介绍本系列暂且告一段落,后续如有需要再进行补充。 现在我们开启新的篇章,在本文中将会介绍无人…

详解两阶段3D目标检测网络PVRCNN:Point-Voxel Feature Set Abstraction for 3D Object Detection

在《动手学无人驾驶(4):基于激光雷达点云数据3D目标检测》一文中介绍了3D目标检测网络PointRCNN。今天介绍该作者新提出的3D检测模型:PVRCNN,论文已收录于CVPR2020。 作者个人主页为:https://sshaoshuai.gi…

一步步编写操作系统 53 任务状态段TSS介绍

操作系统是利用PCB来维护所有任务的,包括进程和线程,但cpu提供的是TSS,linux系统可没用它,因为效率太低。但是还是要了解下TSS才清楚操作系统中某些操作的原因。 本节中所讲的特权级与它有着密不可分的联系,TSS作用不…

动手学无人驾驶(6):基于IMU和GPS数据融合的自车定位

在上一篇博文《动手学无人驾驶(5):多传感器数据融合》介绍了如何使用Radar和LiDAR数据对自行车进行追踪,这是对汽车外界运动物体进行定位。 对于自动驾驶的汽车来说,有时也需要对自身进行更精确的定位,今天…

【Codeforces - 798C】 Mike and gcd problem(思维,贪心)

题干: Mike has a sequence A  [a1, a2, ..., an] of length n. He considers the sequence B  [b1, b2, ..., bn] beautiful if the gcd of all its elements is bigger than 1, i.e. . Mike wants to change his sequence in order to make it beauti…

一步步编写操作系统 48 加载内核1

其实,我们等了这一刻好久好久,即使我不说,大家也有这样的认识,linux内核是用c 语言写的,咱们肯定也要用c语言。其实...说点伤感情的话,今后的工作只是大部分(99%)都要用c语言来写&am…