96、C++ 性能优化一览

96、C++ 性能优化一览

news/2025/7/15 11:03:04/文章来源:https://blog.csdn.net/dongtuoc/article/details/136518997

在对 C++ 版本的 resnet50 经过大约 5 个版本的优化之后，性能也基本达到了预期。至少利用手写的 resnet50 在 CPU 上推理一张图片感觉不到卡顿了。

下面对这几个版本的性能优化做一个总结。

初始版本1

第一版本的 C++ 代码，并没有考虑性能问题，仅仅是想按照手写 resnet50 的想法，先将功能实现，并且确保手写的模型精度没问题，可以正确推理出一张图片。

作为一个基线版本，第一版也是耗费精力最大的一个版本，经过大量的调试之后，终于将模型的精度稳定在了一个可接受的范围内，在我的虚拟机上(基于 Intel CPU）测试了第一版本的性能数据为：

上面是测试了10几张图片的推理性能数据，平均推理一张图片延时为 17s，这个时间肯定是不行的。试想一下，假设人脸识别要等 17 s才能识别出来，使用者会是什么感受。

于是开启了后续几轮性能优化，每一轮优化都是在前面的基础上进行的。

优化版本2

本次优化重点是对卷积的乘累加操作进行的向量化，利用的是 Intel AVX2 指令集进行，将乘法和加法向量化，从而提升了卷积计算的速度，本次优化后，在相同的平台上测试，性能数据为：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/724528.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

操作系统原理与实验——实验四短进程优先调度

操作系统原理与实验——实验四短进程优先调度

实验指南运行环境： Dev c 算法思想： 短进程优先 (SPF)调度算法则是从就绪队列中选出一个估计运行时间最短的进程，将处理机分配给它，使它立即执行并一直执行到完成核心数据结构： typedef struct data{ int hour; int…

阅读更多...

Docker镜像操作介绍

Docker镜像操作介绍

一、镜像操作镜像的操作可分为： 拉取镜像：拉取远程仓库的镜像到本地 docker pull重命名镜像：使用docker tag 命令重命名镜像查看镜像：使用docker image ls 或者 docker images命令查看本地已经存在的镜像删除镜像：删…

阅读更多...

蓝桥杯倒计时 38 天

蓝桥杯倒计时 38 天

整数二分模板：数的范围二分的本质不是单调性，而是二分出能满足某种性质使得将整数分成两半。思考：模板题，模板记熟就能做 #include<iostream> using namespace std; int n,q; const int N 1e510; int a[N]; int main…

阅读更多...

Jenkins 将shell脚本启动方式修改为bash

Jenkins 将shell脚本启动方式修改为bash

platform"arm x86" if [[ "$platform" ~ "arm" ]] thenecho "arm" fi最近在调试Jenkins实现的一些功能，发现在本地可以运行的脚本内容到了Jenkins里面就没办法运行了，不是提示unexpected operator就是提示[[ : …

阅读更多...

Python 系统学习总结（基础语法+函数+数据容器+文件+异常+包+面向对象）

Python 系统学习总结（基础语法+函数+数据容器+文件+异常+包+面向对象）

🔥博客主页： A_SHOWY🎥系列专栏：力扣刷题总结录数据结构云计算数字图像处理力扣每日一题_ 六天时间系统学习Python基础总结，目前不包括可视化部分，其他部分基本齐全，总结记录&#xff0…

阅读更多...

网络编程 24/3/6 作业

网络编程 24/3/6 作业

1、数据库的增删改 #include <myhead.h> int main(int argc, const char *argv[]) {//定义数据库句柄指针sqlite3 *kdbNULL;//打开数据库，不存在则创建if(sqlite3_open("./my.db",&kdb)!SQLITE_OK){printf("sqlite3_open error\n");…

阅读更多...

Golang-如何优雅的关闭一个Channel？

Golang-如何优雅的关闭一个Channel？

如何优雅的关闭Channel 这部分主要参考自：https://qcrao91.gitbook.io/go/channel/ru-he-you-ya-di-guan-bi-channel 直接关闭存在的问题主要就是上述“向已关闭的Channel收发，会如何？”中所提到的情况： 1、向已关闭的channel…

阅读更多...

全连接神经网络算法原理(激活函数、前向传播、梯度下降法、损失函数、反向传播)

全连接神经网络算法原理(激活函数、前向传播、梯度下降法、损失函数、反向传播)

文章目录前言1、全连接神经网络的整体结构：全连接神经网络模型是由输入层、隐藏层、输出层所组成，全连接神经网络结构如下图所示：全连接神经网络的每一层都是由一个一个的神经元所组成的，因此只要搞清楚神经元的本质就可以搞清楚…

阅读更多...

算法竞赛基础：树状数组

算法竞赛基础：树状数组

算法竞赛基础：树状数组是什么？ 树状数组虽然语义上是树状，但是实际上还是一个数组。树状数组的功能就是单点和区间的修改和查询。例如，如果想增加一个点的值，那么你需要让其上方所有能对齐的树状数组c全部增加相同…

阅读更多...

java设计模式课后作业（待批改）

java设计模式课后作业（待批改）

此文章仅记录学习，欢迎各位大佬探讨实验（一） 面向对象设计实验目的 ①使用类来封装对象的属性和功能； ②掌握类变量与实例变量，以及类方法与实例方法的区别； 知识回顾详情见OOP课件实验内容…

阅读更多...

QChart柱状图

QChart柱状图

//柱状图// 创建柱状图数据QBarSet *set0 new QBarSet("");*set0 << 1601 << 974 << 655 << 362;QBarSeries *series new QBarSeries();series->append(set0);set0->setColor(QColor("#F5834B"));// 创建柱状图QChart *ch…

阅读更多...

github双因子认证

github双因子认证

最近换了个安卓手机，打算让之前的苹果手机退役了，所以需要重新搞GitHub的Two-factor authentication 步骤如下： 1. 访问安全中心 https://github.com/settings/security 2. 点击Authenticator app右侧按钮 3. 下载腾讯身份验证器&#xff…

阅读更多...

MySQL作业题

MySQL作业题

一、取得每个部门最高薪水的人员名称第一步：取得每个部门的最高薪水 select e.deptno, max(e.sal) as maxSal from emp e group by e.deptno; ----------------- | deptno | maxSal | ----------------- | 20 | 3000.00 | | 30 | 2850.00 | | 10 | 5…

阅读更多...

CSS常见布局方式

CSS常见布局方式

一、静态布局（Static Layout） 既传统web设计就是不管浏览器尺寸多少，网页布局就按当时写代码的布局来布置; 块级元素：每个块级元素会在上一个元素下面另起一行，他们会被设置好的margin分离。块级元素是垂直组织的。 …

阅读更多...

进程和线程的创建过程

进程和线程的创建过程

进程和线程的创建过程是不同的,具体如下: 进程的创建过程: 进程的创建过程涉及到写时复制(Copy-on-Write,COW)机制。写时复制是一种可以延迟甚至避免拷贝数据的内存映射方式。新进程的创建过程大致如下: 操作系统为新进程分配必要的资源,如进程控制块等。父进程的内存数据区…

阅读更多...

python跨文件夹调用

python跨文件夹调用

如图所示，我们要在bin文件夹下的run_patchcore.py文件中调用src/patchcore文件夹下的backbone.py, common.py等文件。如第13行方法1：将patchcore的上一层目录src添加到环境变量中 run_patchcore.py 文件中写入import sys sys.path.append(/home/rui/P…

阅读更多...

苹果群控软件开发必不可少的代码!

苹果群控软件开发必不可少的代码!

在开发苹果群控软件时，编写高质量的代码是至关重要的，这些代码不仅需要实现功能，还需要保证软件的稳定性、安全性和可扩展性，本文将分享四段在苹果群控软件开发中必不可少的源代码，并解释每段代码的作用和实现原理。一…

阅读更多...

HM2019创建分析模型

HM2019创建分析模型

步骤一：查看单元类类型（通过card edit），然后展开模型查看模型信息；步骤二：为材料集里添加新的材料材料:Al 弹性模量E:70000 泊松比NU:0.33 其中：MAT1表示各向同性材料，E表示弹…

阅读更多...

【漏洞复现】ShopXO任意文件读取漏洞

【漏洞复现】ShopXO任意文件读取漏洞

Nx01 产品简介 ShopXO是一套开源的企业级开源电子商务系统，包含PC、H5、微信小程序、支付宝小程序、百度小程序等多个终端，遵循Apache2开源协议发布，基于ThinkPHP5.1框架研发。该系统具有求实进取、创新专注、自主研发、国内领先企业级B2C电商…

阅读更多...

three.js可以对3D模型做什么操作和交互，这里告诉你。

three.js可以对3D模型做什么操作和交互，这里告诉你。

Three.js 提供了多种交互功能，可以对 3D 模型进行各种操作和交互。以下是一些常见的交互功能： 鼠标交互通过鼠标事件，可以实现模型的拖拽、旋转、缩放等操作。例如，可以通过鼠标拖拽来改变模型的位置或角度。触摸交互对于支…

阅读更多...

最新文章