[NCNN学习笔记]-1

1、前言

本次继续学习NCNN,希望能够坚持,往期学习NCNN的链接如下。

[NCNN学习笔记]-0

2、学习内容

2.1、batchnorm_arm.cpp

这个章节学习NCNN中batchnorm在NEON上的实现。batchnorm的学习可参考链接:https://zhuanlan.zhihu.com/p/93643523

在NCNN中batchnorm的预处理为ncnn-master\src\layer\batchnorm.cpp

int BatchNorm::load_model(const ModelBin& mb)
{slope_data = mb.load(channels, 1);if (slope_data.empty())return -100;mean_data = mb.load(channels, 1);if (mean_data.empty())return -100;var_data = mb.load(channels, 1);if (var_data.empty())return -100;bias_data = mb.load(channels, 1);if (bias_data.empty())return -100;a_data.create(channels);if (a_data.empty())return -100;b_data.create(channels);if (b_data.empty())return -100;// 通过https://zhuanlan.zhihu.com/p/93643523中的公式,可以很推算出下面的过程for (int i = 0; i < channels; i++){float sqrt_var = sqrtf(var_data[i] + eps);if (sqrt_var == 0.f)sqrt_var = 0.0001f; // sanitize divide by zeroa_data[i] = bias_data[i] - slope_data[i] * mean_data[i] / sqrt_var;b_data[i] = slope_data[i] / sqrt_var;}return 0;
}

通过上面的代码,明白了a_data和b_data的作用,下面就正式开始学习在数据处理过程中的batchnorm吧

int BatchNorm_arm::forward_inplace(Mat& bottom_top_blob, const Option& opt) const
{int elembits = bottom_top_blob.elembits();int dims = bottom_top_blob.dims;         // 数据维度,最多为4int elempack = bottom_top_blob.elempack; // 每个数据可被分为多少组   例如float32x4_t可被分为4组if (elempack == 4)    // float32x4_t、int32x4_t、float16x4_t{// 对一行进行batchnormif (dims == 1 ){int w = bottom_top_blob.w; #pragma omp parallel for num_threads(opt.num_threads)for (int i = 0; i < w; i++){float* ptr = (float*)bottom_top_blob + i * 4;   // 每间隔4个数据取一次地址float32x4_t _a = vld1q_f32((const float*)a_data + i * 4); float32x4_t _b = vld1q_f32((const float*)b_data + i * 4);float32x4_t _p = vld1q_f32(ptr);_p = vmlaq_f32(_a, _p, _b);   // _a + _p.*b     y = a_data + b_data * xvst1q_f32(ptr, _p);}}// 对每一行batchnormif (dims == 2){int w = bottom_top_blob.w;int h = bottom_top_blob.h;#pragma omp parallel for num_threads(opt.num_threads)for (int i = 0; i < h; i++){float32x4_t _a = vld1q_f32((const float*)a_data + i * 4);float32x4_t _b = vld1q_f32((const float*)b_data + i * 4);float* ptr = bottom_top_blob.row(i);for (int j = 0; j < w; j++)  {float32x4_t _p = vld1q_f32(ptr);_p = vmlaq_f32(_a, _p, _b);vst1q_f32(ptr, _p);ptr += 4;}}}// 针对channel进行batchnormif (dims == 3 || dims == 4){int w = bottom_top_blob.w;int h = bottom_top_blob.h;int d = bottom_top_blob.d;int c = bottom_top_blob.c;int size = w * h * d;#pragma omp parallel for num_threads(opt.num_threads)for (int q = 0; q < c; q++){float32x4_t _a = vld1q_f32((const float*)a_data + q * 4);float32x4_t _b = vld1q_f32((const float*)b_data + q * 4);float* ptr = bottom_top_blob.channel(q);for (int i = 0; i < size; i++){float32x4_t _p = vld1q_f32(ptr);_p = vmlaq_f32(_a, _p, _b);vst1q_f32(ptr, _p);ptr += 4;}}}return 0;}return 0;
}

2.2、bias_arm.cpp

这个章节学习ncnn中的的bias计算

int Bias_arm::forward_inplace(Mat& bottom_top_blob, const Option& opt) const
{int w = bottom_top_blob.w;int h = bottom_top_blob.h;int d = bottom_top_blob.d;int channels = bottom_top_blob.c;int size = w * h * d;const float* bias_ptr = bias_data;#pragma omp parallel for num_threads(opt.num_threads)for (int q = 0; q < channels; q++){float* ptr = bottom_top_blob.channel(q);  // 第q个channel的数据float bias = bias_ptr[q];int nn = size >> 2; // 处理4的整数倍的数据int remain = size - (nn << 2);     // 剩余处理向量float32x4_t _bias = vdupq_n_f32(bias);for (; nn > 0; nn--){float32x4_t _p = vld1q_f32(ptr);float32x4_t _outp = vaddq_f32(_p, _bias);  // x + biasvst1q_f32(ptr, _outp);   ptr += 4;}// 剩余向量使用c语言计算for (; remain > 0; remain--){*ptr = *ptr + bias;ptr++;}}return 0;
}
3、总结

本次学习了NCNN中的batchnorm和bias操作,后续准备学习NCNN时不局限于学习NCNN中的NEON实现,还会关注其他的内容!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/751171.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C语言】字符函数与字符串函数以及内存函数 { 超详细攻略,一篇学会 }

今日分享&#xff1a;字符、字符串函数和内存函数 内存函数就是对内存进行操作的函数 字符串函数就是对字符串进行操作的函数 字符函数就是对字符进行操作的函数 str前缀的函数是字符串函数&#xff0c;头文件string.h mem前缀的函数是内存函数&#xff0c;头文件stdlib.h 字符…

C#开发五子棋游戏:从新手到高手的编程之旅

C#开发五子棋游戏&#xff1a;从新手到高手的编程之旅 目录 一、引言 二、项目规划与设计思路 三、棋盘与棋子的数据模型构建 四、交互式用户界面设计 五、核心游戏逻辑实现 一、引言 五子棋&#xff0c;作为一种古老的策略型棋类游戏&#xff0c;在全球拥有广泛的爱好者…

25考研数据结构复习·3.3.2栈和队列的应用——表达式求值

三种算术表达式 中缀表达式 ((15/(7-(11)))*3)-(2(11)) 由三个部分组成&#xff1a;操作数、运算符、界限符 运算符在两个操作数中间&#xff1a;ab&#xff1b;ab-c&#xff1b;ab-c*d ❗后缀表达式 逆波兰表达式 运算符在两个操作数后面&#xff1a;ab&#xff1b;abc-或ab…

python知识点总结(二)

这里写目录标题 1、什么是解释性语言&#xff0c;什么是编译性语言&#xff1f;2、说说中作用域是怎么划分的3、type和isinstance方法的区别4、浅拷贝和深拷贝5、python中变量在内存中存储方式6、python中的封装、继承、多态7、python中内存管理机制是怎么样的&#xff1f;8、简…

旋转中心 机械手抓料方式

一、为什么要计算旋转中心&#xff1f; 机器视觉——旋转中心的标定_旋转标定-CSDN博客 在机械手抓料的时候传送带上过来的料可能是各个角度的&#xff0c;不同的位置&#xff0c;这样如果我们没有做好机械手标定的话很难抓取&#xff0c;因此我们要做旋转中和和机械手TCP标定…

章节2:单词本该这样记

为什么我们记不住单词&#xff1f; 单词不是被胡编乱造出来的&#xff0c;单词是有规律的&#xff0c;单词是符合人类的逻辑的。 单词实际意思结构意义历史文化 我们要怎么记单词&#xff1f; 掌握单词的结构规律了解与单词有关的历史文化灵活巧计&#xff0c;不要太拘泥于…

唯一约束

Oracle从入门到总裁:​​​​​​https://blog.csdn.net/weixin_67859959/article/details/135209645 唯一约束 唯一约束的特点是在某一个列上的内容不允许出现重复。 例如&#xff0c;现在要收集用户的信息&#xff0c;假设包含编号&#xff08;mid&#xff09;、姓名&…

【通信原理笔记】【二】随机信号分析——2.3 平稳随机过程的性质

文章目录 前言一、平稳过程的不变性二、平稳过程通过线性时不变系统2.1 输出随机过程的特性2.2 输入输出随机过程的关系 三、平稳过程经过希尔伯特系统总结 前言 在上一篇中我们学习了平稳随机过程这一特殊的随机过程&#xff0c;这篇我们进一步学习平稳过程具有哪些性质。 一…

Word2vec 学习笔记

word2vec 学习笔记 0. 引言1. Word2vec 简介1-1. CBOW1-2. SG 2. 实战 0. 引言 最近研究向量检索&#xff0c;看到有同事使用 MeCab、Doc2Vec&#xff0c;所以把 Word2vec 这块知识学习一下。 1. Word2vec 简介 Word2vec 即 word to vector&#xff0c;顾名思义&#xff0c;…

02python计算与变量

学习目标: 1、计算符号与运算 2、变量的基本使用方法 一、计算符号与运算 Python 中最常用的运算符号有 +(加)、-(减)、*(乘)、/(除)和 %(取余)。 【演示】:在 Python 中进行简单的计算,例如:5 + 3。 在 Python 中,我们可以使用各种运算符号进行数值计算。 …

封装哈希表

本文旨在讲解哈希表的封装&#xff0c;我们以哈希桶的结构来进行封装unorderedmap/set。要想实现封装哈希表&#xff0c;我们首先得先将哈希表的结构给搭建出来&#xff0c;然后再根据哈希桶的结构进一步封装unorderedmap/set&#xff01; 下面我们先来实现哈希桶的结构&#x…

Internet Download Manager(IDM下载) v6.42.3 绿色版介绍

互联网下载管理器是一个广泛使用的软件&#xff0c;它可以帮助用户更好地管理和加速他们的下载。最新版本v6.42.3已经发布&#xff0c;它带来了一系列新功能和改进&#xff0c;让用户更加方便和快速地下载他们需要的文件。 新版本的互联网下载管理器增加了对最新浏览器的支持&…

ROS2+NAV2如何快捷的在docker中使用主机的CAN

驱动底盘一般通过CAN口和底盘通信,在docker中使用CAN最方便的方式就是容器(container)在创建(run)时,指定网络为host模式:--network=host。 例如: docker run -it --restart=always --name ros2humble3 --network=host -v /home/tom/Tom/DockerContent/nav2_ws(your do…

1.Spring入门

1.1 Spring简介 Spring是一个轻量级Java 企业级应用程序开发框架&#xff0c;目的是为了解决企业级应用开发的业务逻辑层和其他各层的耦合问题。它是一个分层的JavaSE/EEfull-stack(一站式) 轻量级开源框架&#xff0c;为开发Java应用程序提供全面的基础架构支持。 Spring Fra…

Linux第80步_使用“信号量”实现“互斥访问”共享资源

1、创建MySemaphoreLED目录 输入“cd /home/zgq/linux/Linux_Drivers/回车” 切换到“/home/zgq/linux/Linux_Drivers/”目录 输入“mkdir MySemaphoreLED回车”&#xff0c;创建“MySemaphoreLED”目录 输入“ls回车”查看“/home/zgq/linux/Linux_Drivers/”目录下的文件…

【git】常用操作

基础操作 git init 初始化仓库 要使用 Git 进行版本管理&#xff0c;必须先初始化仓库&#xff0c; 执行了 git init命令的目录下就会生成 .git 目录。这个 .git 目录里存储着管理当前目录内容所需的仓库数据 git status 查看仓库状态 工作树和仓库在被操作的过程中&#xff0…

C++-线程池

1、使用C构造线程类 #include <iostream> #include <stdio.h> #include <stdlib.h> #include <queue> #include <cstring> #include <time.h> #include <unistd.h> #include <pthread.h> #include <thread> #include &…

Github: Github actions 自动化工作原理与多workflow创建

Github actions 1 &#xff09;概述 Github Actions 是Github官方推出的 CI/CD 解决方案 https://docs.githu.com/en/actions 优点 自动发布流程可减少发布过程中手动操作成本&#xff0c;大幅提升ci/cd效率&#xff0c;快速实现项目发布上线 缺点 存在较高的技术门槛需要利用…

Cloudways搭建WordPress外贸独立站完整教程

现在做个网站不比从前了&#xff0c;搭建网站非常的简单&#xff0c;主要是由于开源的CMS建站系统的崛起&#xff0c;就算不懂编程写代码的人也能搭建一个自己的网站&#xff0c;这些CMS系统提供了丰富的主题模板和插件&#xff0c;使用户可以通过简单的拖放和配置操作来建立自…

使用 Next.js 配置接口跨域

在现代 Web 开发中&#xff0c;跨域请求是一个常见的问题。当我们尝试从一个域&#xff08;例如example.com&#xff09;向另一个域&#xff08;例如api.example.com&#xff09;发送 HTTP 请求时&#xff0c;由于浏览器的同源策略限制&#xff0c;这个请求可能会被阻止。为了解…