faster rcnn end2end 训练与测试

除了前面讲过的rpn与fast rcnn交替训练外,faster rcnn还提供了一种近乎联合的训练,姑且称为end2end训练。

根据论文所讲,end2end的训练一气呵成,对于前向传播,rpn可以作为预设的网络提供proposal.而在后向传播中,rpn,与fast rcnn分别传导,而汇聚到shared layer.,但是没有考虑掉roi pooling层对于predicted bounding box的导数。如下图:



我们这里截取Ross'Girshick 在ICCV15上的ppt<Training'R-CNNs'  of  'various  'velocities   Slow, fast, and faster>  



对于roi pooling层,显然依赖于图像本身,和roi区域。对于fast rcnn来讲,roi是固定的,而对于faster rcnn来说,roi是通过rpn产生的,rpn不定,所以roi的生成依赖于

图像。



但是由于最大池化的作用,所以没有办法对roi的四个位置求导。




所以忽略掉对于roi的导数,当然了如果改变max pooling的方式,比如如下所说采取双线性插值,这样输出既有roi的坐标也有图像像素值,则可以关于roi求导。





根据github上py-faster-rcnn描述

  • For training smaller networks (ZF, VGG_CNN_M_1024) a good GPU (e.g., Titan, K20, K40, ...) with at least 3G of memory suffices
  • For training Fast R-CNN with VGG16, you'll need a K40 (~11G of memory)
  • For training the end-to-end version of Faster R-CNN with VGG16, 3G of GPU memory is sufficient (using CUDNN)

使用end2end的训练方式,显存也减少了,从原先的11g减少到3g.我觉得主要的原因是在原先的交替训练中,rpn训练结束后,会有一个rpn生成的过程,这时会生成所有训练图片的proposals,而这是个巨大的负担。而使用end2end的方式训练,一次训练一张图片,rpn阶段产生一张图片的proposal,然后送入fast rcnn训练。显然这种方法很省时也很省内存。


对于end2end的测试,从网络配置上基本与交替训练的相同。在一些小的细节,比如end2end测试时仍然保留了drop层,而对于交替训练的方式,在训练阶段有,测试时去掉了。

下面给出了个人画的end2end的训练网络图。

请访问:链接


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/258619.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jquery ui动态切换主题的一种实现方式

这两天看coreservlets上的jQuery教程&#xff0c;虽然比较老了&#xff0c;不过讲得还是不错。最后一部分讲jQuery ui 主题切换&#xff0c;用他介绍的方法实现不了。于是自己修改了下&#xff0c;可以了。代码如下&#xff1a;html部分&#xff1a;<fieldset class"ui…

[学习总结]7、Android AsyncTask完全解析,带你从源码的角度彻底理解

我们都知道&#xff0c;Android UI是线程不安全的&#xff0c;如果想要在子线程里进行UI操作&#xff0c;就需要借助Android的异步消息处理机制。之前我也写过了一篇文章从源码层面分析了Android的异步消息处理机制&#xff0c;感兴趣的朋友可以参考 Android Handler、Message完…

python字频统计软件_python结巴分词以及词频统计实例

python结巴分词以及词频统计实例发布时间&#xff1a;2018-03-20 14:52,浏览次数&#xff1a;773, 标签&#xff1a;python# codingutf-8Created on 2018年3月19日author: chenkai结巴分词支持三种分词模式&#xff1a;精确模式: 试图将句子最精确地切开&#xff0c;适合文…

html从入门到卖电脑(三)

CSS3中和动画有关的属性有三个 transform、 transition 和 animation。下面来一一说明: transform 从字面来看transform的释义为改变&#xff0c;使…变形&#xff1b;转换 。这里我们就可以理解为变形。那都能怎么变呢&#xff1f; none 表示不进行变换&#xff1b; rotat…

visual studio 2015安装 无法启动程序,因为计算机丢失D3DCOMPILER_47.dll 的解决方法

对于题目中的解决方法&#xff0c;我查到了微软提供的一个方案&#xff1a;https://support.microsoft.com/en-us/help/4019990/update-for-the-d3dcompiler-47-dll-component-on-windows 进入如下页面&#xff1a;http://www.catalog.update.microsoft.com/Search.aspx?qKB4…

UI1_UIView层操作

// // ViewController.m // UI1_UIView层操作 // // Created by zhangxueming on 15/7/1. // Copyright (c) 2015年 zhangxueming. All rights reserved. //#import "ViewController.h"interface ViewController ()endimplementation ViewController- (void)view…

JavaScript Patterns 1 Introduction

1.1 Pattern "theme of recurring events or objects… it can be a template or model which can be used to generate things" (http://en.wikipedia.org/wiki/Pattern). • Design patterns - Elements of Reusable Object-Oriented Software. • Coding patte…

基于像素聚类的分割方法基于slic的方法_博士论文摘要 | 张荣春:数码影像与TLS点云数据融合提取地质结构面方法研究...

《测绘学报》构建与学术的桥梁 拉近与权威的距离数码影像与TLS点云数据融合提取地质结构面方法研究张荣春1,21.南京邮电大学地理与生物信息学院, 江苏 南京 210023;2.河海大学地球科学与工程学院, 江苏 南京 211100收稿日期&#xff1a;2019-03-27基金项目&#xff1a;国家自然…

制作IOS 后台极光推送时,遇到的小问题

推送广义上分为两种&#xff0c; 一种是 程序在前台的时候&#xff0c;不想在任务栏里面显示通知&#xff0c;直接在app中进行某种操作。这个叫做自定义消息。这个是在前台时&#xff0c;app与极光后台建立了一个长链接。 另一种是 程序处于前、后台 或者杀死状态的时候&…

Visual Studio 2008 环境变量的配置(参考设置VS2010)

本文转载自&#xff1a;http://blog.csdn.net/tracyliang223/article/details/21539361COPY FROM&#xff1a;http://www.cnblogs.com/waterlin/archive/2011/10/31/2230341.html 在调试 Visual Studio 2008 程序时&#xff0c;经常有一些动态链接库&#xff08;即 dll 文件&am…

Linq 中 Any与All

昨天突然看到之前写的一个积累文档&#xff0c;其中文档中有一个Linq Any和All的注意事项&#xff1a;注意Any 和 All var list new List<int>(); var aa list.All(n > n > 1); var bb list.Any(n > n > 1); // aa: true bb: false其中List是一个元…

jaxb转xml空值双标签_单品运营思维:标签-词路-聚焦-直搜-超直

非标品标签思维&#xff1a;针对非标品 主要是2.0为主的打法根据搜索入池的关键词&#xff0c;有什么词做什么词。有个细节&#xff1a;不一定进什么词做什么词&#xff0c;这个维度当中加入3.0的思维3.0入手 转2.0再切3.0(检测词路健康度&#xff0c;非严格意义估算单量)举例&…

如何在PFSense中设置故障转移和负载平衡

故障转移是一种备份操作模式&#xff0c;仅在主系统由于系统故障或任何计划停机时间而变得不可用时&#xff0c;系统组件&#xff08;如网络&#xff09;的操作才由辅助系统承担。在本教程中&#xff0c;我们将看到如何设置故障转移和负载平衡&#xff0c;以使pfSense能够将流量…

图像金字塔总结

本文转载自&#xff1a; http://blog.csdn.net/dcrmg/article/details/52561656 一、 图像金字塔 图像金字塔是一种以多分辨率来解释图像的结构&#xff0c;通过对原始图像进行多尺度像素采样的方式&#xff0c;生成N个不同分辨率的图像。把具有最高级别分辨率的图像放在底部…

表单的get和post使用情景

GET和POST两种方法都是将数据送到服务器&#xff0c;但你该用哪一种呢&#xff1f;HTTP标准包含这两种方法是为了达到不同的目的。POST用于创建资源&#xff0c;资源的内容会被编入HTTP请示的内容中。例如&#xff0c;处理订货表单、在数据库中加入新数据行等。 当请求无副作用…

什么叫做罗列式_项目起盘的时候,如何确定自己该做什么社群?

这是祁杰『社群日记』第48篇持续日更&#xff0c;做最懂社群的营销咨询人很多人手上有资源&#xff0c;准备起盘项目的时候&#xff0c;总会思考一个问题&#xff1a;我能做什么样的社群&#xff1f;今天我们从用户需求出发&#xff0c;拆解一下哪些社群是能够确切地满足用户的…

C++ exit 与 return 浅析

【摘要】 本文从代码形式。经常使用方式&#xff0c;相关概念&#xff0c;调用关系和比較分析&#xff0c;这5个维度浅析 exit 与 return 在C的同样点与差别。【常见形式】 exit(0)&#xff1a; 正常执行程序并退出程序。 exit(1)&#xff1a; 非正常执行导致退出程序&…

Feature Pyramid Networks for Object Detection 总结

最近在阅读FPN for object detection,看了网上的很多资料&#xff0c;有些认识是有问题的&#xff0c;当然有些很有价值。下面我自己总结了一下&#xff0c;以供参考。 1. FPN解决了什么问题&#xff1f; 答&#xff1a; 在以往的faster rcnn进行目标检测时&#xff0c;无论…

最近工作

最近的工作忙且乱&#xff0c;以至于&#xff0c;我第天早晨早早起来到晚上11点多才能回到家。今天早晨写代码的时候腰突然猛疼&#xff0c;疼的我直叫唤。躺在床上半天起不来。 最近每天的工作要计划一下了&#xff0c;不能客户说干嘛就干嘛&#xff0c;这样累坏了自己&#x…

LeetCode OJ - Candy

题目&#xff1a; There are N children standing in a line. Each child is assigned a rating value. You are giving candies to these children subjected to the following requirements: Each child must have at least one candy.Children with a higher rating get mor…