SSD: ReLU6

 

1、在src\caffe\proto\caffe.proto中搜索message LayerParameter,在optional ReLUParameter relu_param = 123之后添加optional ReLU6Parameter relu6_param = 208; (最后的分号别忘了)

2、搜索message ReLUParameter,在这个ReLUParameter实现结构之后添加

// Message that stores parameters used by ReLU6Layer
message ReLU6Parameter {
  enum Engine {
    DEFAULT = 0;
    CAFFE = 1;
    CUDNN = 2;
  }
  optional Engine engine = 2 [default = DEFAULT];
}

支持proto头文件修改完毕,接下来添加所需的头文件和实现文件。

1.在blob/ssd/include/caffe/layers文件夹下新建relu6_layer.hpp,将

 

 
#ifndef CAFFE_RELU_LAYER_HPP_
#define CAFFE_RELU_LAYER_HPP_#include <vector>#include "caffe/blob.hpp"
#include "caffe/layer.hpp"
#include "caffe/proto/caffe.pb.h"#include "caffe/layers/neuron_layer.hpp"namespace caffe {/*** @brief Rectified Linear Unit non-linearity @f$ y = \min(6, \max(0, x)) @f$.*        The simple max is fast to compute, and the function does not saturate.*/
template <typename Dtype>
class ReLU6Layer : public NeuronLayer<Dtype> {public:/*** @param param provides ReLUParameter relu_param,*     with ReLULayer options:*   - negative_slope (\b optional, default 0).*     the value @f$ \nu @f$ by which negative values are multiplied.*/explicit ReLU6Layer(const LayerParameter& param): NeuronLayer<Dtype>(param) {}virtual inline const char* type() const { return "ReLU6"; }protected:/*** @param bottom input Blob vector (length 1)*   -# @f$ (N \times C \times H \times W) @f$*      the inputs @f$ x @f$* @param top output Blob vector (length 1)*   -# @f$ (N \times C \times H \times W) @f$*      the computed outputs @f$*        y = \max(0, x)*      @f$ by default.  If a non-zero negative_slope @f$ \nu @f$ is provided,*      the computed outputs are @f$ y = \max(0, x) + \nu \min(0, x) @f$.*/virtual void Forward_cpu(const vector<Blob<Dtype>*>& bottom,const vector<Blob<Dtype>*>& top);virtual void Forward_gpu(const vector<Blob<Dtype>*>& bottom,const vector<Blob<Dtype>*>& top);/*** @brief Computes the error gradient w.r.t. the ReLU inputs.** @param top output Blob vector (length 1), providing the error gradient with*      respect to the outputs*   -# @f$ (N \times C \times H \times W) @f$*      containing error gradients @f$ \frac{\partial E}{\partial y} @f$*      with respect to computed outputs @f$ y @f$* @param propagate_down see Layer::Backward.* @param bottom input Blob vector (length 1)*   -# @f$ (N \times C \times H \times W) @f$*      the inputs @f$ x @f$; Backward fills their diff with*      gradients @f$*        \frac{\partial E}{\partial x} = \left\{*        \begin{array}{lr}*            0 & \mathrm{if} \; x \le 0 \\*            \frac{\partial E}{\partial y} & \mathrm{if} \; x > 0*        \end{array} \right.*      @f$ if propagate_down[0], by default.*      If a non-zero negative_slope @f$ \nu @f$ is provided,*      the computed gradients are @f$*        \frac{\partial E}{\partial x} = \left\{*        \begin{array}{lr}*            \nu \frac{\partial E}{\partial y} & \mathrm{if} \; x \le 0 \\*            \frac{\partial E}{\partial y} & \mathrm{if} \; x > 0*        \end{array} \right.*      @f$.*/virtual void Backward_cpu(const vector<Blob<Dtype>*>& top,const vector<bool>& propagate_down, const vector<Blob<Dtype>*>& bottom);virtual void Backward_gpu(const vector<Blob<Dtype>*>& top,const vector<bool>& propagate_down, const vector<Blob<Dtype>*>& bottom);
};}  // namespace caffe#endif  // CAFFE_RELU_LAYER_HPP_
 

 

 

 

2.在blob/ssd/src/caffe/layers文件夹下新建relu6_layer.cpp,将

 

#include <algorithm>
#include <vector>#include "caffe/layers/relu6_layer.hpp"namespace caffe {template <typename Dtype>
void ReLU6Layer<Dtype>::Forward_cpu(const vector<Blob<Dtype>*>& bottom,const vector<Blob<Dtype>*>& top) {const Dtype* bottom_data = bottom[0]->cpu_data();Dtype* top_data = top[0]->mutable_cpu_data();const int count = bottom[0]->count();for (int i = 0; i < count; ++i) {top_data[i] = std::min(std::max(bottom_data[i], Dtype(0)), Dtype(6));}
}template <typename Dtype>
void ReLU6Layer<Dtype>::Backward_cpu(const vector<Blob<Dtype>*>& top,const vector<bool>& propagate_down,const vector<Blob<Dtype>*>& bottom) {if (propagate_down[0]) {const Dtype* bottom_data = bottom[0]->cpu_data();const Dtype* top_diff = top[0]->cpu_diff();Dtype* bottom_diff = bottom[0]->mutable_cpu_diff();const int count = bottom[0]->count();for (int i = 0; i < count; ++i) {bottom_diff[i] = top_diff[i] * ((bottom_data[i] > 0 && bottom_data[i] < 6));}}
}#ifdef CPU_ONLY
STUB_GPU(ReLU6Layer);
#endifINSTANTIATE_CLASS(ReLU6Layer);
REGISTER_LAYER_CLASS(ReLU6);}  // namespace caffe

 

 

 

3.在blob/ssd/src/caffe/layers文件夹下新建relu6_layer.cu,将

 

#include <algorithm>
#include <vector>#include "caffe/layers/relu6_layer.hpp"namespace caffe {template <typename Dtype>
__global__ void ReLU6Forward(const int n, const Dtype* in, Dtype* out) {CUDA_KERNEL_LOOP(index, n) {out[index] = in[index] < 0 ? 0: (in[index] > 6 ? 6 : in[index]);}
}template <typename Dtype>
void ReLU6Layer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom,const vector<Blob<Dtype>*>& top) {const Dtype* bottom_data = bottom[0]->gpu_data();Dtype* top_data = top[0]->mutable_gpu_data();const int count = bottom[0]->count();// NOLINT_NEXT_LINE(whitespace/operators)ReLU6Forward<Dtype><<<CAFFE_GET_BLOCKS(count), CAFFE_CUDA_NUM_THREADS>>>(count, bottom_data, top_data);CUDA_POST_KERNEL_CHECK;// << " count: " << count << " bottom_data: "//     << (unsigned long)bottom_data//     << " top_data: " << (unsigned long)top_data//     << " blocks: " << CAFFE_GET_BLOCKS(count)//     << " threads: " << CAFFE_CUDA_NUM_THREADS;
}template <typename Dtype>
__global__ void ReLU6Backward(const int n, const Dtype* in_diff,const Dtype* in_data, Dtype* out_diff) {CUDA_KERNEL_LOOP(index, n) {out_diff[index] = in_diff[index] * ((in_data[index] > 0)&& (in_data[index] < 6));}
}template <typename Dtype>
void ReLU6Layer<Dtype>::Backward_gpu(const vector<Blob<Dtype>*>& top,const vector<bool>& propagate_down,const vector<Blob<Dtype>*>& bottom) {if (propagate_down[0]) {const Dtype* bottom_data = bottom[0]->gpu_data();const Dtype* top_diff = top[0]->gpu_diff();Dtype* bottom_diff = bottom[0]->mutable_gpu_diff();const int count = bottom[0]->count();// NOLINT_NEXT_LINE(whitespace/operators)ReLU6Backward<Dtype><<<CAFFE_GET_BLOCKS(count), CAFFE_CUDA_NUM_THREADS>>>(count, top_diff, bottom_data, bottom_diff);CUDA_POST_KERNEL_CHECK;}
}INSTANTIATE_LAYER_GPU_FUNCS(ReLU6Layer);}  // namespace caffe

 

重新编译ssd。

转载于:https://www.cnblogs.com/crazybird123/p/9602781.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/485167.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【剑指offer】面试题12:矩阵中的路径(Java)

请设计一个函数&#xff0c;用来判断在一个矩阵中是否存在一条包含某字符串所有字符的路径。路径可以从矩阵中的任意一格开始&#xff0c;每一步可以在矩阵中向左、右、上、下移动一格。如果一条路径经过了矩阵的某一格&#xff0c;那么该路径不能再次进入该格子。例如&#xf…

2021年斯坦福AI指数报告重磅出炉!中国AI期刊影响力首超美国,视频处理是新风口...

来源&#xff1a;AI科技评论作者&#xff1a;AI科技评论CV在快速工业化&#xff0c;大公司正扩大计算鸿沟。就在刚刚&#xff0c;斯坦福大学正式发布《2021年人工智能指数报告》&#xff08;“Artificial Intelligence Index Report 2021”&#xff09;&#xff01;报告链接&am…

16重新安装HA0.63

2018-02-24 14:17:46 https://home-assistant.io/docs/installation/raspberry-pi/首先安装2017-11-29-raspbian-stretch树莓派镜像到SD卡&#xff0c;步骤如下&#xff1a;下载镜像文件&#xff0c;转到网页https://www.raspberrypi.org/downloads/raspbian/&#xff0c;下载“…

【剑指 offer】面试题13:机器人的运动范围(Java)

地上有一个m行n列的方格&#xff0c;从坐标 [0,0] 到坐标 [m-1,n-1] 。一个机器人从坐标 [0, 0] 的格子开始移动&#xff0c;它每次可以向左、右、上、下移动一格&#xff08;不能移动到方格外&#xff09;&#xff0c;也不能进入行坐标和列坐标的数位之和大于k的格子。例如&am…

超人类AI的幻想与思考:自下而上构建的自我迭代意识系统

来源&#xff1a;人民网或许很多人都幻想过&#xff0c;如果有一天&#xff0c;人工智能超越了人类的智力水平&#xff0c;世界将会发声怎样天翻地覆的变化。而在这个看似遥远&#xff0c;又似乎近在咫尺的幻想实现之前&#xff0c;不放让我们来深入探讨一下&#xff0c; 怎样才…

【剑指offer】面试题14- I:剪绳子(Java)

给你一根长度为 n 的绳子&#xff0c;请把绳子剪成整数长度的 m 段&#xff08;m、n都是整数&#xff0c;n>1并且m>1&#xff09;&#xff0c;每段绳子的长度记为 k[0],k[1]...k[m] 。请问 k[0]*k[1]*...*k[m] 可能的最大乘积是多少&#xff1f;例如&#xff0c;当绳子的…

elk安装

官网下载最新的rpm包安装。 http://blog.51cto.com/liqingbiao/1928653 es安装head 先安装node wget https://nodejs.org/dist/v0.10.48/node-v0.10.48.tar.gz 加压&#xff0c;make&#xff0c;make install node --version git clone https://github.com/mobz/elasticsearch…

2021城市大脑与智能产业趋势简报第五期

《城市大脑与智能产业趋势简报》是“城市大脑全球标准研究组”推荐的一周内城市大脑和智能产业领域值得关注的重要科技进展、新闻动态、专家观点和专业知识。本次周报&#xff08;2021.2.24-2021.3.3&#xff09;共推荐99条重要信息&#xff08;点击链接地址可以直接打开阅读&a…

【剑指offer】面试题15:二进制中1的个数(Java)

请实现一个函数&#xff0c;输入一个整数&#xff0c;输出该数二进制表示中 1 的个数。例如&#xff0c;把 9 表示成二进制是 1001&#xff0c;有 2 位是 1。因此&#xff0c;如果输入 9&#xff0c;则该函数输出 2。 示例 1&#xff1a; 输入&#xff1a;000000000000000000…

物理理论发展放缓?这是一种认知误判

来源&#xff1a;光明日报作者&#xff1a;李侠&#xff0c;系上海交通大学科学史与科学文化研究院院长、教授物理基础理论的发展是否已经停滞。这是一个经常被人们提起但其实很复杂的问题。基于科学哲学的基本理论&#xff0c;笔者认为&#xff1a;以物理学为代表的基础理论仍…

【剑指offer】面试题16:数值的整数次方(Java)

实现函数double Power(double base, int exponent)&#xff0c;求base的exponent次方。不得使用库函数&#xff0c;同时不需要考虑大数问题。 示例 1: 输入: 2.00000, 10 输出: 1024.00000 示例 2: 输入: 2.10000, 3 输出: 9.26100 示例 3: 输入: 2.00000, -2 输出: 0.25000…

php blog to explore

https://www.zachstronaut.com/posts/2009/02/09/careful-with-php-empty.html转载于:https://www.cnblogs.com/qinqiu/p/9606348.html

【剑指offer】面试题18:删除链表的节点(Java)

给定单向链表的头指针和一个要删除的节点的值&#xff0c;定义一个函数删除该节点。 返回删除后的链表的头节点。 注意&#xff1a;此题对比原题有改动 示例 1: 输入: head [4,5,1,9], val 5 输出: [4,1,9] 解释: 给定你链表中值为 5 的第二个节点&#xff0c;那么在调用…

java容器02--ArrayList源码分析

1.1 ArrayList 1. 概览 实现了 RandomAccess 接口&#xff0c;因此支持随机访问。这是理所当然的&#xff0c;因为 ArrayList 是基于数组实现的。 public class ArrayList<E> extends AbstractList<E>implements List<E>, RandomAccess, Cloneable, java.io.…

斯坦福连续发了四年的AI报告,今年讲了什么?

来源&#xff1a;机器之心报道编辑&#xff1a;蛋酱、魔王、陈萍由斯坦福大学发起的人工智能指数&#xff08;AI Index&#xff09;是一个追踪 AI 动态和进展的非营利性项目&#xff0c;旨在全面研究 AI 行业状况&#xff0c;旨在促进基于数据的 AI 广泛交流和有效对话。刚刚&a…

【剑指offer】面试题19:正则表达式匹配(Java)

请实现一个函数用来匹配包含. 和*的正则表达式。模式中的字符.表示任意一个字符&#xff0c;而*表示它前面的字符可以出现任意次&#xff08;含0次&#xff09;。在本题中&#xff0c;匹配是指字符串的所有字符匹配整个模式。例如&#xff0c;字符串"aaa"与模式"…

面试-重写基础功能函数

重写基础函数 1. 字符串拷&#xff1a;strcpy() 函数strcpy的原型是char* strcpy(char* des , const char* src)&#xff0c;des 和 src 所指内存区域不可以重叠且 des 必须有足够的空间来容纳 src 的字符串。 char* strcpy( char* dst, const char* src ) {assert( NULL ! ds…

第一次,人类在人工神经网络中发现了“真”神经元

来源&#xff1a;学术头条本文经授权转载自机器之心&#xff08;almosthuman2014&#xff09;OpenAI 的研究者们在人工神经网络 CLIP 上发现了「真」神经元&#xff0c;这种机制解释了 AI 模型对令人惊讶的视觉呈现进行分类时&#xff0c;为何拥有如此的准确性。研究人员表示&a…

【剑指offer】面试题21:调整数组顺序使奇数位于偶数前面(Java)

输入一个整数数组&#xff0c;实现一个函数来调整该数组中数字的顺序&#xff0c;使得所有奇数位于数组的前半部分&#xff0c;所有偶数位于数组的后半部分。 示例&#xff1a; 输入&#xff1a;nums [1,2,3,4] 输出&#xff1a;[1,3,2,4] 注&#xff1a;[3,1,2,4] 也是正确…

#35 string(缩点+动态规划)

容易发现有了交换相邻字符的操作后&#xff0c;只要字符串所含有的字符种类和数量相同其就是等价的。这样的状态只有n^3级别&#xff0c;将其抽象成点子串变换抽象成边后就是求最长路径了&#xff0c;缩点dp解决。 码量巨大&#xff0c;不是很明白要怎样才能用3k写完。 #includ…