[导读]近日,大华股份基于深度学习技术研发的3D目标检测技术,刷新了The KITTI Vision Benchmark Suite中3D车辆类目检测任务(3D Object Detection Evaluation)排行榜,取得了3D车辆类目检测第一名,这标志着大华股份的人工智能技术在3D目标检测领域处于国际领先水平。
大华股份在人工智能的核心技术领域持续耕耘,不断提升智能算法、算力的核心竞争力。这是大华股份继取得字符识别、场景流识别、目标跟踪、2D目标检测、行人重识别等多项国际竞赛第一之后,再次在3D目标检测领域取得突破。
关于KITTI:
KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的计算机视觉算法评测数据集之一。数据集用于评测立体匹配(stereo)、光流(flow)、场景流(sceneflow)、视觉里程计(visual odometry)、物体检测(object detection)和跟踪(tracking)、道路分割(road)、语义分割(semantics)等计算机视觉技术的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中最多包含15辆车和30个行人,且存在不同程度的遮挡与截断。
3D目标检测
3D目标检测是自动驾驶领域的核心技术之一,自动驾驶的汽车需要实时检测周围所有交通参与者,包括机动车、非机动车、行人,并准确地检测出各个目标的位置、大小和运动方向。由于2D图像缺少深度信息,难以准确地估计目标的距离,加上天气、光照、阴影等因素的影响,基于视觉的2D目标检测技术难以应对复杂的道路环境,因此自动驾驶技术中主要依靠基于雷达设备所采集的点云数据进行3D目标检测,同时采用基于2D的图像识别技术提高3D目标检测的准确性。
本次竞赛在大华自主研发的深度学习平台上,汲取了2D目标检测、场景流识别等算法的优点,研发了一套基于图模型和神经网络的3D目标检测框架,使用3D点云数据与2D图像数据,从多个视角进行目标检测,并将多视角的检测结果进行融合,有效地提升了3D目标检测的准确性。
该项国际竞赛数据集的车辆3D检测效果图
图1 3D检测效果图
图2 点云数据的鸟瞰图效果