详解道路标记数据集 CeyMo: See More on Roads -- A Novel Benchmark Dataset for Road Marking Detection

在这里插入图片描述
本文介绍一个新的道路标记检测数据集,论文收录于 WACV2022Ceymo数据集总共包含2887张图片,标注了11类4706个道路标记实例,图片分辨率为 1920×10801920\times10801920×1080。其中,对于每一个道路标记实例,作者采用了三种标注方式:多边形、bounding box以及像素级标注。 除此之外,作者还提供了数据集评价指标和脚本程序,在数据集上作者还使用了实例分割目标检测两种检测方法进行对比,作为baseline。从实验结果来看,实例分割的方法准确度高于目标检测方法。

2021-11-17日补充: 论文数据集下载地址:

  • Train set - https://drive.google.com/file/d/1-TDEfGXtEQ4s037M_ynmV6aiOfNp2NZv/view?usp=sharing
  • Test set - https://drive.google.com/file/d/1YhWld3kxR5Ahz4Q-hy61UKI0KN_so9fa/view?usp=sharing

论文链接:https://arxiv.org/abs/2110.11867


1.Benchmark Dataset

首先介绍数据集收集工作,作者通过车载摄像头进行录像采集,然后从视频片段中提取出包含道路标记的图片。

采集完之后,作者使用了labelme标注工具手动标注,将道路标记标注为多边形。除了多边形标注之外,还有bounding box和像素级标注,下图是其中一张图片的标注结果。
在这里插入图片描述
下面介绍下数据集分布情况,整个数据集划分为训练集(2099张图片)测试集(788张图片),数据集分为11类,统计情况如表3所示;测试集划分为6个场景,统计情况如表2所示。
在这里插入图片描述
下面是评价指标,作者使用了两个评价指标,首先是 F1F_1F1 评价指标,当预测区域与真值区域的 IoU>0.3IoU>0.3IoU>0.3 则预测为真阳性。
F1−score =2×precision ×recall precision +recall F_{1-\text { score }}=\frac{2 \times \text { precision } \times \text { recall }}{\text { precision }+\text { recall }} F1 score = precision + recall 2× precision × recall 

为了计算所有类别的平均分值,作者还使用了 MarcoF1Marco F_1MarcoF1 评价指标,公式为:
Macro- F1−score =1C∑i=1CF1-score i\text { Macro- } F_{1}-\text { score }=\frac{1}{C} \sum_{i=1}^{C} F_{1} \text {-score }_{i}  Macro- F1 score =C1i=1CF1-score i


2.Methodology

下面介绍论文使用的检测方法。作者总共使用了两种方法(如下图所示)。

  • (a)目标检测方法,首先将原始图片逆投影转换为鸟瞰图,这有助于移除大量的背景区域,只保留地面区域。作者使用的检测网络为SSD,使用了两种主干网:MobileNet-v1Inception-v2。所有模型输入图片分辨率为 500×500500\times500500×500。最后再将输出的bbox转换到原始图片中。
  • (b)实例分割方法,使用的网络为Mark-RCNN,同样也使用了两种主干网:Inception-v2ResNet-50。输入图片分辨率也为 500×500500\times500500×500

在这里插入图片描述


3.Experiments & Results

最后是实验设置,因为在采集的数据集中存在类别不平衡问题,作者首先进行了数据增强处理。如水平翻转、调整图片饱和度、亮度和对比度等。训练使用的是TensorFlow API(具体细节可看原文)。

下面是实验结果(如下表所示),可以看到实例分割方法的准确度高于目标检测方法的准确度。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/439563.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VBA类之一(初识类)

第一章 开头篇 ——认识类 Visual Basic是基于对象的编程(注:本文所有的代码和讨论将都以VB为基础模型,不过我会尽量使用一些大家在VBA中常见的例子来做说明的。),所以我们常见的一些东西其实都与类有关。不…

【HDU - 5009】Paint Pearls(dp,链表优化dp)

题干: Lee has a string of n pearls. In the beginning, all the pearls have no color. He plans to color the pearls to make it more fascinating. He drew his ideal pattern of the string on a paper and asks for your help. In each operation, he sele…

动手学无人驾驶(7):车道线检测

最近在研究视觉语义地图,需要进行车道线检测,发现这篇车道线检测论文效果蛮好的 (Ultra Fast Structure-aware Deep Lane Detection)。论文作者在知乎上已经介绍过了:https://zhuanlan.zhihu.com/p/157530787&#xff…

Coursera自动驾驶课程第16讲:LIDAR Sensing

在第15讲《Coursera自动驾驶课程第15讲:GNSS and INS Sensing for Pose Estimation》 我们学习了自动驾驶定位中常用的两种传感器:IMU(惯性测量单元) 和GNSS(全球导航卫星系统)。 本讲我们将学习自动驾驶汽…

DB、ETL、DW、OLAP、DM、BI关系结构图

在此大概用口水话简单叙述一下他们几个概念: (1)DB/Database/数据库——这里一般指的就是OLTP数据库,在线事物数据库,用来支持生产的,比如超市的买卖系统。DB保留的是数据信息的最新状态,只有一…

Tarjan 算法 常用模板

可以求每个点属于第几个强连通分量&#xff1a;https://blog.csdn.net/dellaserss/article/details/8267192 int Tarjan(int u){int v;dfn[u]low[u]Index;stack[Top]u;Instack[u]1;for(int i0;i<G[u].size();i){vG[u][i];if(!dfn[v]){Tarjan(v);low[u]min(low[u],low[v]);}…

【HDU - 5012】Dice(模拟,bfs)

题干&#xff1a; There are 2 special dices on the table. On each face of the dice, a distinct number was written. Consider a 1.a 2,a 3,a 4,a 5,a 6 to be numbers written on top face, bottom face, left face, right face, front face and back face of dice A. S…

重读经典:《Generative Adversarial Nets》

GAN论文逐段精读【论文精读】这是李沐博士论文精读的第五篇论文&#xff0c;这次精读的论文是 GAN。目前谷歌学术显示其被引用数已经达到了37000。GAN 应该是机器学习过去五年上头条次数最多的工作&#xff0c;例如抖音里面生成人物卡通头像&#xff0c;人脸互换以及自动驾驶中…

一步步编写操作系统 62 函数调用约定

由于我们要将c语言和汇编语言结合编程啦&#xff0c;所以一定会存在汇编代码和c代码相互调用的问题&#xff0c;有些事情还是要提前交待给大家的&#xff0c;本节就是要给大家说下函数调用规约中的那些事儿。 函数调用约定是什么&#xff1f; 调用约定&#xff0c;calling co…

重读经典:《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》

ViT论文逐段精读【论文精读】这次李沐博士邀请了亚马逊计算机视觉专家朱毅博士来精读 Vision Transformer&#xff08;ViT&#xff09;&#xff0c;强烈推荐大家去看本次的论文精读视频。朱毅博士讲解的很详细&#xff0c;几乎是逐词逐句地讲解&#xff0c;在讲解时把 ViT 相关…

【Gym - 101612C】【2017-2018NEERC】Consonant Fencity(状压枚举,预处理)

题干&#xff1a; 把26个字母分成19个辅音字母和7个元音字母&#xff0c;让你通过 将某些字母改为大写状态&#xff0c;使得字符串中连续的两个大小写状态不同的辅音字母组成的字母对数量最多&#xff0c;输出该状态下的字符串。注意输出的字符串中同一字母必须形态统一&#…

浅谈Mysql 表设计规范

本文首先探讨下数据库设计的三大范式&#xff0c;因为范式只是给出了数据库设计的原则&#xff0c;并没有告诉我们实际操作中应该怎样操作&#xff0c;应该注意什么&#xff0c;所以我们还会谈下实际工作中需要注意的具体操作问题。 三大范式 首先放出三大范式内容&#xff0c…

从零开始学视觉Transformer(1):Hello Vision Transformer

Vision Transformer打卡营分享一门很棒的 ViT 课程&#xff0c;课程详细介绍可以看这篇文章&#xff1a; 《Vision Transformer打卡营来啦&#xff01;朱欤博士带你从零玩转ViT爆款模型&#xff01;》

SQLServer中ISNULL、NULLIF和CONVERT函数

效率&#xff1a; UNION和UNION ALL关键字都是将两个结果集合并为一个&#xff0c;但这两者从使用和效率上来说都有所不同。 1、对重复结果的处理&#xff1a;UNION在进行表链接后会筛选掉重复的记录&#xff0c;Union All不会去除重复记录。 2、对排序的处理&#xff1a;Union…

一步步编写操作系统 66 浅析c库函数与系统调用1

本来说好的接下来的工作是要去“丰满”我们的内核&#xff0c;可咱们这种一步一回头的学习方式还得继续啊。其实我了解大家急切写内核的心情&#xff0c;但本书《操作系统真象还原》&#xff08;请大家支持正版&#xff09;的目的不是写一个操作系统就完事了&#xff0c;而是让…

给不会调用C++STL库中二分函数lower_bound,upper_bound,binary_search同学的一些话!

lower_bound算法返回第一个大于等于给定值所在的位置。设置两个指针start和last&#xff0c;其中start指向数组的起始位置&#xff0c;last指向数组末尾位置之后的位置。当start和last指向相同位置时循环结束。mid指向[start,last)区间的中间位置&#xff0c;当中间位置元素值大…

详解IMU标定经典论文:A Robust and Easy to Implement Method for IMU Calibration without External Equipments

本文介绍一篇 关于IMU 标定的经典论文&#xff0c;论文收录于 ICRA14&#xff0c;在论文中作者介绍了如何不适用外部设备标定 IMU 加速度和角速度偏差、尺度系数、轴偏移参数。 论文链接&#xff1a;https://readpaper.com/paper/2021503353、https://readpaper.com/paper/221…