深度学习中的FLOPs补充

深度学习中的FLOPs补充

news/2025/4/27 10:21:27/文章来源:https://blog.csdn.net/weixin_45840973/article/details/140289755

学习了博主的介绍（深度学习中的FLOPs介绍及计算(注意区分FLOPS)-CSDN博客）后，对我不理解的内容做了一点补充。链接放到下边啦

https://blog.csdn.net/qq_41834400/article/details/120283103

FLOPs：注意s小写，是floating point operations的缩写（s表复数），意指浮点运算数，理解为计算量。可以用来衡量算法/模型的复杂度。

1 全连接网络中FLOPs的计算博主说的很详细了就不介绍了

2 解释一下CNN中FLOPs的计算中我不理解的地方

生成输出特征图的一个通道的一个像素点的计算过程

对于每个输入通道，我们有 $K*K$ 次乘法和 $K^2 - 1$ 次加法。因此，单个输入通道的计算次数为： $K^2$ 次乘法+ $K^2 - 1$ 次加法

注意 $K^2 - 1$ 是卷积核和输入特征图对应元素相乘后得到的 $K*K$ 个数，把他们 对应相加的过程！！！！！！

总共的计算次数为： $2K^2 - 1$

所有输入通道的计算次数

对于所有 $C_{in}$ 个输入通道，还需要将所有通道的结果相加形成输出的一个通道的特征图。因此，每个输出像素点需要额外的 $C_{in}-1$ 次加法。因此，总的计算次数为：

$C_{in} \times (2K^2 - 1) + (C_{in} - 1) = C_{in} \times 2K^2 - C_{in} + C_{in} - 1 = 2C_{in} \times K^2 - 1$

也就是博主提到的下边这个过程

若考虑到偏置，可以看看卷积操作中，偏置是怎么起作用的，参考这个博主的

https://blog.csdn.net/qq_42103167/article/details/105056598?spm=1001.2014.3001.5506

（每个卷积核是和输入特征图的通道是一样的！！！）偏置是在输出特征图的每个像素点的卷积操作完成后（比如三通道，三次卷积操作后），加上的。所以一次卷积操作偏置加1。

整个输出特征图的计算次数

$(2C_{in} \times K^2 - 1) \times H \times W$

所有输出通道的计算次数

由于有 $C_{out}$ 个输出通道，因此总的计算次数为： $(2C_{in} \times K^2 - 1) \times H \times W \times C_{out}$

卷积层FLOPs的计算公式如下(不考虑bias时有-1，有bias时没有-1):

$\text{FLOPs} = (2C_{in} \times K^2 - 1) \times H \times W \times C_{out}$

感觉博主推荐的链接也不错，有空看看

(60 封私信 / 82 条消息) CNN 模型所需的计算力（flops）和参数（parameters）数量是怎么计算的？ - 知乎 (zhihu.com)

分享一个FLOPs计算神器 - 简书 (jianshu.com)

我们可以发现，具有相似的FLOPs的网络，执行的速度却不一样。有的相差还挺大。
使用FLOP作为计算复杂度的唯一指标是不充分的。

为什么不能只用FLOPs作为指标呢？
作者认为有如下几个原因：

FLOPs没有考虑几个对速度有相当大影响的重要因素。 2）计算平台的不同。
FLOPs没有考虑几个对速度有相当大影响的重要因素
MAC和并行度

链接：https://www.jianshu.com/p/b1ceaa7effa8

CNN解说员 (poloclub.github.io)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/871089.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

.Net Core 微服务之Consul（二）-集群搭建

.Net Core 微服务之Consul（二）-集群搭建

引言：集合上一期.Net Core 微服务之Consul（一）(.Net Core 微服务之Consul（一）-CSDN博客) 。目录一、 Consul集群搭建 1. 高可用 1.1 高可用性概念 1.2 高可用集群的基本原理 1.3 高可用集群的架构设计 1.3.1 主从复制架构 1.3.2 共享存储架构 1.3.3 负载均衡…

阅读更多...

小程序字体图标使用iconfont 阿里巴巴矢量图

小程序字体图标使用iconfont 阿里巴巴矢量图

打开链接 iconfont官网进入素材库-官方图标库中挑选适合的字体图标放到购物车点击导航栏中购物车图标把选中的图标添加至项目然后在我的项目中找到项目点击【查看在线链接】点击图中【暂无代码，点此生成】生成 css 文件链接点击 css 打开 css 文…

阅读更多...

OBD诊断（ISO15031） 06服务

OBD诊断（ISO15031） 06服务

文章目录功能简介ISO 9141-2、ISO 14230-4和SAE J1850的诊断服务定义1、请求特定监控系统的车载监控测试结果请求消息定义（读取支持的TID）2、请求特定监控系统响应消息定义的车载监控测试结果（报告支持的TID）3、请求特定监控系统…

阅读更多...

每天一个数据分析题（四百二十七）- 方差分析

每天一个数据分析题（四百二十七）- 方差分析

下面是一个方差分析表： 表中A，B，C，D，E五个单元格内的数据分别是（ ）。 A. 40，5，35，60，1.71 B. 40，5，35，60&a…

阅读更多...

自动驾驶决策和控制系统的研究

自动驾驶决策和控制系统的研究

摘要自动驾驶汽车的决策和控制系统是实现自主驾驶的核心部分。本文详细探讨了自动驾驶系统中决策和控制的基本原理、主要方法及其在实际应用中的挑战与前景。通过对路径规划、行为决策、运动控制等关键环节的分析，本文旨在为自动驾驶技术的发展提供理论基础和实践指…

阅读更多...

Linux 安装elk

Linux 安装elk

1. ElasticSearch安装（1）解压到 /opt （2）创建elk用户因为ElasticSearch不支持Root用户直接操作，因此我们需要创建一个elk用户 useradd elk chown -R elk:elk /opt/elasticsearch-7.17.0 （3）在/opt/elasticsearch-7.17.0/config 配置elasticsearch.yml node.name…

阅读更多...

The Web3 社区 Web3 产品经理课程

The Web3 社区 Web3 产品经理课程

概述 / 深耕区块链行业 11 年，和很多产品经理都打过交道；遇到过优秀的产品经理，也遇到过比较拉垮的产品经理。多年工作中，曾在某些团队，承载技术兼产品经理的角色；也参与过很多 Web3 外包项目，包…

阅读更多...

科技与狠活

科技与狠活

科技与狠货，已经见怪不怪了从黑龙江到海南，从上海到新疆，960万平方公里，十三亿人，每个地方都是科技与狠活在抖音上面看到一个评论，如果蔬菜没科技与狠活，估计会很贵，但是我想到在…

阅读更多...

JSqlParser 解析 sql

JSqlParser 解析 sql

目录前言一、Maven依赖二、获取sql中的表名三、获取sql中的具体信息前言 JSqlParser是一个 SQL 语句解析器。它将 SQL 语句转换为可遍历的 Java 类层次结构，可以方便的用代码对 SQL 语句进行解析，修改等操作。官网 api 文档和 github 地址如下&…

阅读更多...

redux教程2024

redux教程2024

redux教程2024 1.安装redux yarn add redux /npm i redux 2.创建目录 action/reducer/store 3.编写action const sendAction()>{return {type:send_type,value:i am action} } module.exports{sendAction }4.编写reducer const initState{value:init } const reducer…

阅读更多...

【北京迅为】《i.MX8MM嵌入式Linux开发指南》-第一篇嵌入式Linux入门篇-第二十九章 NFS服务器的搭建和使用

【北京迅为】《i.MX8MM嵌入式Linux开发指南》-第一篇嵌入式Linux入门篇-第二十九章 NFS服务器的搭建和使用

i.MX8MM处理器采用了先进的14LPCFinFET工艺，提供更快的速度和更高的电源效率;四核Cortex-A53，单核Cortex-M4，多达五个内核 ，主频高达1.8GHz，2G DDR4内存、8G EMMC存储。千兆工业级以太网、MIPI-DSI、USB HOST、WIFI/BT…

阅读更多...

使用Spring Boot实现服务发现和注册

使用Spring Boot实现服务发现和注册

使用Spring Boot实现服务发现和注册大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！ 在微服务架构中，服务发现和注册是至关重要的组件。它们允许服务动态地查找并相互通信，简…

阅读更多...

如何通过QGC实现无人机的自动化任务，包括飞行计划的制定和执行。

如何通过QGC实现无人机的自动化任务，包括飞行计划的制定和执行。

通过QGroundControl (QGC) 实现无人机的自动化任务，包括飞行计划的制定和执行，主要涉及以下几个步骤： 规划飞行任务上传飞行任务执行飞行任务监控飞行任务 1. 规划飞行任务 QGC 提供了一个直观的用户界面用于规划飞行任务。用户可以在地图…

阅读更多...

GEO的表达矩阵的探针ID转换成基因名称教程

GEO的表达矩阵的探针ID转换成基因名称教程

GEO的表达矩阵的探针ID转换成基因名称教程前情回顾根据GSE id自动下载处理GEO数据(必须要运行的模块) 该模块的运行窗口截图该模块的教程知乎地址：根据GEO的GSE数据集编号自动下载和处理GEO数据教程: https://zhuanlan.zhihu.com/p/708053447 该根据GSE id…

阅读更多...

大模型最新黑书：基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理 PDF

大模型最新黑书：基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理 PDF

今天给大家推荐一本丹尼斯罗斯曼(Denis Rothman)编写的关于大语言模型（LLM）权威教程<<大模型应用解决方案> 基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理>！Google工程总监Antonio Gulli作序，这含金量不…

阅读更多...

观察者模式的实现

观察者模式的实现

引言：观察者模式——程序中的“通信兵” 在现代战争中，通信是胜利的关键。信息力以网络、数据、算法、算力等为底层支撑，在现代战争中不断推动感知、决策、指控等各环节产生量变与质变。在软件架构中，观察者模式扮演着类似的角色…

阅读更多...

最小二乘算法的解

最小二乘算法的解

最小二乘法（Least Squares）是一种用于寻找线性回归模型的最佳拟合直线的标准方法。它通过最小化数据点与拟合直线之间的平方差来找到最佳拟合的线性模型。线性回归模型假设我们有一组数据点 (xi,yi)，线性回归模型的目标是找到系数 w 和截…

阅读更多...

css预编译器--sass

css预编译器--sass

Sass Sass 提供了变量（variables）、嵌套规则（nested rules）、混合（mixins）、函数（functions），目前我使用最多的还是变量和嵌套规则，貌似目前css也支持嵌套…

阅读更多...

2024年高职物联网实验室建设及物联网实训平台整体解决方案

2024年高职物联网实验室建设及物联网实训平台整体解决方案

随着物联网技术的蓬勃发展，其在各行业的应用日益广泛，对具备物联网专业技能的高素质人才需求也急剧增加。为了满足这一市场需求，高职院校作为技能型人才培养的重要阵地，亟需加强物联网专业的建设。本文旨在提出《2024年高职物联网…

阅读更多...

一个开源完全免费的无损视频或音频的剪切/裁剪/分割/截取和视频合并工具

一个开源完全免费的无损视频或音频的剪切/裁剪/分割/截取和视频合并工具

大家好，今天给大家分享一款致力于成为顶尖跨平台FFmpeg图形用户界面应用的软件工具LosslessCut。 LosslessCut是一款致力于成为顶尖跨平台FFmpeg图形用户界面应用的软件工具，专为实现对视频、音频、字幕以及其他相关媒体资产的超高速无损编辑而精心打造。…

阅读更多...

最新文章