faster rcnn end2end 训练与测试

faster rcnn end2end 训练与测试

news/2025/4/27 11:28:39/文章来源:https://wangcaiyong.blog.csdn.net/article/details/78536224

除了前面讲过的rpn与fast rcnn交替训练外，faster rcnn还提供了一种近乎联合的训练，姑且称为end2end训练。

根据论文所讲，end2end的训练一气呵成，对于前向传播，rpn可以作为预设的网络提供proposal.而在后向传播中，rpn,与fast rcnn分别传导，而汇聚到shared layer.,但是没有考虑掉roi pooling层对于predicted bounding box的导数。如下图：

我们这里截取Ross'Girshick 在ICCV15上的ppt<Training'R-CNNs' of 'various 'velocities Slow, fast, and faster>

对于roi pooling层，显然依赖于图像本身，和roi区域。对于fast rcnn来讲，roi是固定的，而对于faster rcnn来说，roi是通过rpn产生的，rpn不定，所以roi的生成依赖于

图像。

但是由于最大池化的作用，所以没有办法对roi的四个位置求导。

所以忽略掉对于roi的导数，当然了如果改变max pooling的方式，比如如下所说采取双线性插值，这样输出既有roi的坐标也有图像像素值，则可以关于roi求导。

根据github上py-faster-rcnn描述

For training smaller networks (ZF, VGG_CNN_M_1024) a good GPU (e.g., Titan, K20, K40, ...) with at least 3G of memory suffices
For training Fast R-CNN with VGG16, you'll need a K40 (~11G of memory)
For training the end-to-end version of Faster R-CNN with VGG16, 3G of GPU memory is sufficient (using CUDNN)

使用end2end的训练方式，显存也减少了，从原先的11g减少到3g.我觉得主要的原因是在原先的交替训练中，rpn训练结束后，会有一个rpn生成的过程，这时会生成所有训练图片的proposals,而这是个巨大的负担。而使用end2end的方式训练，一次训练一张图片，rpn阶段产生一张图片的proposal，然后送入fast rcnn训练。显然这种方法很省时也很省内存。

对于end2end的测试，从网络配置上基本与交替训练的相同。在一些小的细节，比如end2end测试时仍然保留了drop层，而对于交替训练的方式，在训练阶段有，测试时去掉了。

下面给出了个人画的end2end的训练网络图。

请访问：链接

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/258619.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

jquery ui动态切换主题的一种实现方式

jquery ui动态切换主题的一种实现方式

这两天看coreservlets上的jQuery教程，虽然比较老了，不过讲得还是不错。最后一部分讲jQuery ui 主题切换，用他介绍的方法实现不了。于是自己修改了下，可以了。代码如下：html部分：<fieldset class"ui…

阅读更多...

[学习总结]7、Android AsyncTask完全解析，带你从源码的角度彻底理解

[学习总结]7、Android AsyncTask完全解析，带你从源码的角度彻底理解

我们都知道，Android UI是线程不安全的，如果想要在子线程里进行UI操作，就需要借助Android的异步消息处理机制。之前我也写过了一篇文章从源码层面分析了Android的异步消息处理机制，感兴趣的朋友可以参考 Android Handler、Message完…

阅读更多...

python字频统计软件_python结巴分词以及词频统计实例

python字频统计软件_python结巴分词以及词频统计实例

python结巴分词以及词频统计实例发布时间：2018-03-20 14:52,浏览次数：773, 标签：python# codingutf-8Created on 2018年3月19日author: chenkai结巴分词支持三种分词模式：精确模式: 试图将句子最精确地切开，适合文…

阅读更多...

html从入门到卖电脑（三）

html从入门到卖电脑（三）

CSS3中和动画有关的属性有三个 transform、 transition 和 animation。下面来一一说明: transform 从字面来看transform的释义为改变，使…变形；转换。这里我们就可以理解为变形。那都能怎么变呢？ none 表示不进行变换； rotat…

阅读更多...

visual studio 2015安装无法启动程序，因为计算机丢失D3DCOMPILER_47.dll 的解决方法

visual studio 2015安装无法启动程序，因为计算机丢失D3DCOMPILER_47.dll 的解决方法

对于题目中的解决方法，我查到了微软提供的一个方案：https://support.microsoft.com/en-us/help/4019990/update-for-the-d3dcompiler-47-dll-component-on-windows 进入如下页面：http://www.catalog.update.microsoft.com/Search.aspx?qKB4…

阅读更多...

UI1_UIView层操作

UI1_UIView层操作

// // ViewController.m // UI1_UIView层操作 // // Created by zhangxueming on 15/7/1. // Copyright (c) 2015年 zhangxueming. All rights reserved. //#import "ViewController.h"interface ViewController ()endimplementation ViewController- (void)view…

阅读更多...

JavaScript Patterns 1 Introduction

JavaScript Patterns 1 Introduction

1.1 Pattern "theme of recurring events or objects… it can be a template or model which can be used to generate things" (http://en.wikipedia.org/wiki/Pattern). • Design patterns - Elements of Reusable Object-Oriented Software. • Coding patte…

阅读更多...

基于像素聚类的分割方法基于slic的方法_博士论文摘要 | 张荣春：数码影像与TLS点云数据融合提取地质结构面方法研究...

基于像素聚类的分割方法基于slic的方法_博士论文摘要 | 张荣春：数码影像与TLS点云数据融合提取地质结构面方法研究...

《测绘学报》构建与学术的桥梁拉近与权威的距离数码影像与TLS点云数据融合提取地质结构面方法研究张荣春1,21.南京邮电大学地理与生物信息学院, 江苏南京 210023;2.河海大学地球科学与工程学院, 江苏南京 211100收稿日期：2019-03-27基金项目：国家自然…

阅读更多...

制作IOS 后台极光推送时，遇到的小问题

制作IOS 后台极光推送时，遇到的小问题

推送广义上分为两种， 一种是程序在前台的时候，不想在任务栏里面显示通知，直接在app中进行某种操作。这个叫做自定义消息。这个是在前台时，app与极光后台建立了一个长链接。另一种是程序处于前、后台或者杀死状态的时候&…

阅读更多...

Visual Studio 2008 环境变量的配置（参考设置VS2010）

Visual Studio 2008 环境变量的配置（参考设置VS2010）

本文转载自：http://blog.csdn.net/tracyliang223/article/details/21539361COPY FROM：http://www.cnblogs.com/waterlin/archive/2011/10/31/2230341.html 在调试 Visual Studio 2008 程序时，经常有一些动态链接库（即 dll 文件&am…

阅读更多...

Linq 中 Any与All

Linq 中 Any与All

昨天突然看到之前写的一个积累文档，其中文档中有一个Linq Any和All的注意事项：注意Any 和 All var list new List<int>(); var aa list.All(n > n > 1); var bb list.Any(n > n > 1); // aa: true bb: false其中List是一个元…

阅读更多...

jaxb转xml空值双标签_单品运营思维：标签-词路-聚焦-直搜-超直

jaxb转xml空值双标签_单品运营思维：标签-词路-聚焦-直搜-超直

非标品标签思维：针对非标品主要是2.0为主的打法根据搜索入池的关键词，有什么词做什么词。有个细节：不一定进什么词做什么词，这个维度当中加入3.0的思维3.0入手转2.0再切3.0(检测词路健康度，非严格意义估算单量)举例&…

阅读更多...

如何在PFSense中设置故障转移和负载平衡

如何在PFSense中设置故障转移和负载平衡

故障转移是一种备份操作模式，仅在主系统由于系统故障或任何计划停机时间而变得不可用时，系统组件（如网络）的操作才由辅助系统承担。在本教程中，我们将看到如何设置故障转移和负载平衡，以使pfSense能够将流量…

阅读更多...

图像金字塔总结

图像金字塔总结

本文转载自： http://blog.csdn.net/dcrmg/article/details/52561656 一、图像金字塔图像金字塔是一种以多分辨率来解释图像的结构，通过对原始图像进行多尺度像素采样的方式，生成N个不同分辨率的图像。把具有最高级别分辨率的图像放在底部…

阅读更多...

表单的get和post使用情景

表单的get和post使用情景

GET和POST两种方法都是将数据送到服务器，但你该用哪一种呢？HTTP标准包含这两种方法是为了达到不同的目的。POST用于创建资源，资源的内容会被编入HTTP请示的内容中。例如，处理订货表单、在数据库中加入新数据行等。当请求无副作用…

阅读更多...

什么叫做罗列式_项目起盘的时候，如何确定自己该做什么社群？

什么叫做罗列式_项目起盘的时候，如何确定自己该做什么社群？

这是祁杰『社群日记』第48篇持续日更，做最懂社群的营销咨询人很多人手上有资源，准备起盘项目的时候，总会思考一个问题：我能做什么样的社群？今天我们从用户需求出发，拆解一下哪些社群是能够确切地满足用户的…

阅读更多...

C++ exit 与 return 浅析

C++ exit 与 return 浅析

【摘要】本文从代码形式。经常使用方式，相关概念，调用关系和比較分析，这5个维度浅析 exit 与 return 在C的同样点与差别。【常见形式】 exit(0)： 正常执行程序并退出程序。 exit(1)： 非正常执行导致退出程序&…

阅读更多...

Feature Pyramid Networks for Object Detection 总结

Feature Pyramid Networks for Object Detection 总结

最近在阅读FPN for object detection,看了网上的很多资料，有些认识是有问题的，当然有些很有价值。下面我自己总结了一下，以供参考。 1. FPN解决了什么问题？ 答： 在以往的faster rcnn进行目标检测时，无论…

阅读更多...

最近工作

最近工作

最近的工作忙且乱，以至于，我第天早晨早早起来到晚上11点多才能回到家。今天早晨写代码的时候腰突然猛疼，疼的我直叫唤。躺在床上半天起不来。最近每天的工作要计划一下了，不能客户说干嘛就干嘛，这样累坏了自己&#x…

阅读更多...

LeetCode OJ - Candy

LeetCode OJ - Candy

题目： There are N children standing in a line. Each child is assigned a rating value. You are giving candies to these children subjected to the following requirements: Each child must have at least one candy.Children with a higher rating get mor…

阅读更多...

最新文章