2018年5月5日论文阅读

国外精读!title(27):We don’t need no bounding-boxes: Training object class detectors using only human verification(我们不需要任何边界框:只使用人工验证来训练对象类别检测器)---20170424

这篇文章主要设计了一个框架,输入是图片和image-level的类标签。目标就是:1、训练detector,能够自动predict出比较好的bounding box;2、减小人工标注bounding box的工作量。

文章的内容和目标检测有关。目标检测两个基本的模式包括:1)全监督:即需要提供所有物体的bounding box 2) 弱监督:只提供图片级别的标签,无bounding box 3) 半监督:介于两者之间。与这些模式不同,本文提出了一种全新的训练detector的方式:

如上图所示,文章首先生成很多proposal出发,然后从一个传统的弱监督检测算法出发,训练出一个detector,每次将分数最高的输出交给标注者做验证,然后根据反馈 1) 重新训练detector 2) 去除掉明显不可能的proposal。作者在文章中提出了两种验证的方式:

  1. 标注者只回答Yes/No,即框是不是框住了一个特定的物体。

  2. 如果回答是No,标注者要提供更详细的信息:Part, Container, Mixed, Missed,分别对应以下四种情况:

如果采用后者的标注方式,则可以根据这些信息进一步筛选proposal,这里文章作者引入了本文最大的一个限制条件来达到这个目的:限制每张图每类物体只能有一个bounding box。如果加上这个条件,例如对于Part的标注,那么我们可以消除掉所有和这个bounding box不相交的框,从而快速缩小搜索的范围。

下面是一个两种标注方法比较的例子,可以看到额外的信息确实大幅提高了找到正确框的速度:

在最后的实验中,和全监督的方法比较,本文的方法以牺牲6%(51%->45%)的代价将标注时间缩短了6到9倍。不过由于是在VOC这样相对较小的数据集上进行的实验,我相信如果将数据规模加大,这个性能差距会更进一步减小。

综上所述,本文提供了一个全新的目标检测训练方式,将人工验证带入到整个训练流程中,通过active learning的办法,力求在人工标注的速度和准确性上取得了一个平衡。除了前面提到的本文的限制,文章使用的active learning的算法也比较初级,这些都制约了算法的最终性能。然而如果从这个文章拓展出去,我们可以发现有很多有意思的问题有待解决,例如:

  1. 对于类别数目很多的分类问题,我们怎么更为有效地转化为适合人类分类的二元分类问题加快数据标注?我们如何设计这样二元问题可以使每次标注得到的信息量最大?

  2. 对于目标检测问题,除了这种判断Yes/No的方式,是否有更多快速但是可以提供更多信息的标注方式?例如是否可以通过某种快速的点击提供更多的位置信息从而转化问题为一种全新的弱监督学习的问题?

  3. 在视频数据上,如何更有效地利用时序信息进行标注和训练?

很希望这些问题在不久的未来都会有圆满的解决,这些问题在这个数据为上的时代不管从理论还是实践上都有很大的意义 :)

 

转载于:https://www.cnblogs.com/ariel-dreamland/p/8993683.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/398070.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

sql2005主从数据库同步配置

网站规模到了一定程度之后,该分的也分了,该优化的也做了优化,但是还是不能满足业务上对性能的要求;这时候我们可以考虑使用主从库。主从库是两台服务器上的两个数据库,主库以最快的速度做增删改操作最新数据的查询操作…

java接口废弃注释_Java注释Override、Deprecated、SuppressWarnings详解

四、如何对注释进行注释这一节的题目读起来虽然有些绕口,但它所蕴涵的知识却对设计更强大的java程序有很大帮助。在上一节讨论了自定义注释,由此我们可知注释在J2SE5.0中也和类、接口一样。是程序中的一个基本的组成部分。既然可以对类、接口进行注释&am…

C语言再学习——分支结构

if语句是最简单的分之结构。 包含系统头文件用尖括号&#xff0c;但是包含自定义的头文件用双引号&#xff1b; #include<math.h>包含系统头文件 #include “lpj.h” 包含自定义头文件 goto语句在函数体内进行&#xff0c;跳转到其他地方。 do…while语句最少被执行一次。…

InceptionV2----Batch Normalization层

一、BN层的操作 1.BN层的操作位置&#xff1a;在非线性映射之前&#xff0c;目的是为了减少梯度消失和梯度爆炸。 1.对输入的x做归一化 2.增加2个参数&#xff0c;提高模型表达能力 3.理想情况下E和Var应该是针对整个数据集的&#xff0c;但显然这是不现实的。因此&#xff0c;…

Rsync命令详解

说明&#xff1a;Rsync是linux/Unix文件同步和传送工具。用于替代rcp的一个工具&#xff0c;rsync可以通过rsh或ssh使用&#xff0c;也能以daemon模式去运行&#xff0c;在以daemon方式运行时rsync server会开一个873端口&#xff0c;等待客户端去连接。连接时&#xff0c;rsyn…

java二次开发浏览器内核_深入理解基于Selenium的二次开发

对于做web端自动化测试的人来说&#xff0c;可能接触selenium比QTP还要多&#xff0c;但是我们在做基于selenium的二次开发的时候&#xff0c;经常会说到二次开发是 为了易于维护&#xff0c;很多人可能不懂得维护的价值是什么&#xff0c;和到底要维护什么。今天专门写一篇关于…

UVA 10600 ACM Contest and Blackout (次小生成树)

题目大意&#xff1a; 给n个节点&#xff0c;m条边&#xff0c;问最小生成树&#xff0c;次小生成树&#xff1f; ps&#xff1a;以前做次小生成树的时候估计没有掌握牢固&#xff0c;这次wa的好辛苦哟。 1 #include <cmath>2 #include <queue>3 #include <stri…

codeforces 234E Champions' League

传送门&#xff1a;http://codeforces.com/problemset/problem/234/E 题目大意&#xff1a;&#xff08;注意要用文件&#xff09;有n个队伍&#xff0c;每个队伍都有一个积分&#xff0c;按照积分高低顺序列出4个等级&#xff08;每个等级n/4个&#xff0c;所以n一定是4的倍数…

前端技术之_CSS详解第五天

前端技术之_CSS详解第五天 一、行高和字号 1.1 行高 CSS中&#xff0c;所有的行&#xff0c;都有行高。盒模型的padding&#xff0c;绝对不是直接作用在文字上的&#xff0c;而是作用在“行”上的。 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN&qu…

pxe装机dhcp获取不到_关于PXE服务器环境搭建流程中遇到的问题及解决方法

环境准备中遇到的问题首先需要将系统镜像挂载到 /mnt&#xff1a;#mount /dev/sdd2 /mnt/usb_disk 将U盘挂载#cp rhel-server-7.6-x86_64-dvd.iso /home 系统镜像拷到本地#mount -o loop rhel-server-7.6-x86_64-dvd.iso /mnt问题&#xff1a;ifconfig命令未找到解决&#xff1…

DB天气app冲刺二阶段第七天

又冲刺了一个礼拜了 今天收获应该算是不小了 虽然进度上来说还是一点也没前进 但是找到了好几个突破口 明天继续 今天先不多说了困了。。转载于:https://www.cnblogs.com/gaih/p/4550612.html

一小时包教会 —— webpack 入门指南

什么是 webpack&#xff1f; webpack是近期最火的一款模块加载器兼打包工具&#xff0c;它能把各种资源&#xff0c;例如JS&#xff08;含JSX&#xff09;、coffee、样式&#xff08;含less/sass&#xff09;、图片等都作为模块来使用和处理。 我们可以直接使用 require(XXX) 的…

判断一个js对象,是否具有某个属性

一个对象&#xff0c;想必我们关注的最多的应该是它上面的属性有哪些吧。那么&#xff0c;怎么判断一个对象是否具有某个属性呢&#xff1f; 1 /*下面是一个对比&#xff0c;看看在判断是否包括一个键上面&#xff0c;Object结构和Set结构的写法不同。*/2 // 对象的写法3 …

JAVA如何代码静态检查术语_Sonar代码静态检查规则-JAVA篇(二)

最近又搜罗整理了一些代码扫描规则&#xff0c;今天继续把这些扫描规则分享给老铁们&#xff0c;以后想学一些开发规则了&#xff0c;直接打开学一学就好了。不多说&#xff0c;直接上干货&#xff01;规则五、".equals()" should not be used to test the values of…

【每日scrum】NO.5

进入冲刺第五天&#xff0c;软件的界面设计成为主打&#xff0c;收集学校的很多美图是我们组的任务&#xff1b; 问题在于软件已很难有很大的改进&#xff0c;大方向也都是变不了的转载于:https://www.cnblogs.com/wantong/p/4553003.html

Python Dataframe转List

1 from pandas import read_csv2 3 dataframe read_csv(rurl, nrows 86400, usecols [0,], enginepython)4 #nrows:读取行数&#xff0c;usecols[n,]:仅读取第n列&#xff0c;usecols[a,b,c]:读取a、b、c列5 dataset dataframe.values6 7 List []8 for k in dataset: 9 …

使用/proc/meminfo文件查看内存状态信息

在Linux下可以使用/proc/meminfo文件查看操作系统内存的使用状态# cat /proc/meminfo MemTotal: 16333852 kB MemFree: 1633564 kB Buffers: 212448 kB Cached: 4422808 kB SwapCached: 0 kB Active: 10343096 kB Inactiv…

java 简单图片浏览器_Java实现简单的图片浏览器

第一次写博客&#xff0c;不喜勿喷。最近一个小师弟问我怎么用Java做图片浏览器&#xff0c;感觉好久没玩Java了&#xff0c;就自己动手做了一下。学校的教程是用Swing来做界面的&#xff0c;所以这里也用这个来讲。首先要做个大概的界面出来&#xff0c;eclipse有一个很好用的…

60. Spring Boot写后感【从零开始学Spring Boot】

从2016年4月15日到2016年7月20日经历长达3个月的时间&#xff0c;【从零开始学习Spring Boot】系列就要告一段落了。国内的各种资源都比较乱或者是copy 来copy去的&#xff0c;错了也不加以修正下&#xff0c;导致通过百度找到的资源可能都是错误的&#xff0c;正是由于这么一种…

五角星

import turtle turtle.setup(600,400,0,0) turtle.bgcolor(red) turtle.color(yellow) turtle.fillcolor(yellow) turtle.begin_fill() for i in range(5):turtle.forward(200)turtle.right(144) turtle.end_fill()turtle.done()转载于:https://www.cnblogs.com/Paris-YY/p/900…