深度学习模型参数的计算

1. 模型尺寸与参数量

根据神经网络模型中的参数数量估计模型体积的大小涉及多个考虑因素,包括参数的数据类型、每种数据类型的存储要求以及存储模型结构或元数据的任何额外开销。下面是估计模型大小的一般方法:

1.1.数据类型

神经网络参数通常存储为浮点数(例如,32 位浮点数)。但是,某些模型可能会使用较低精度的格式,例如 16 位浮点数,甚至是 8 位整数来量化模型。

存储要求:确定所选数据类型的存储要求。例如:

32-bit floats:.32 位浮点数:每个参数需要 4 个字节的存储空间。
16-bit floats:16 位浮点数:每个参数需要 2 个字节的存储空间。
8-bit integers: .8 位整数:每个参数需要 1 个字节的存储空间。

参数量:计算神经网络模型中的参数总数。这包括所有层的权重和偏差。

1.2 计算模型大小

.计算大小:将参数数量乘以所选数据类型的存储要求,得到模型的总大小(以字节为单位)。

Model size (bytes)=Number of parameters×Storage per parameter (bytes)

记住,这是一个基本估计值,实际大小可能会因模型压缩技术、稀疏表示以及存储模型结构或元数据所需的任何额外开销等因素而有所不同。

例如,如果您有一个包含 100 万个参数的神经网络,并且您使用的是 32 位浮点数,则估计大小:

Model size=1,000,000×4 bytes=4,000,000 bytes

1.3 转换成以M 为单位

当然,如果您的模型以 32 位浮点格式存储,并且您希望以兆字节 (MB) 为单位表示大小,则可以使用以下步骤:

  1. 确定神经网络模型中的参数数。

  2. 将参数数乘以每个参数的存储(32 位浮点数为 4 个字节)。

  3. 将结果除以 2 20 2^{20} 220将字节转换为兆字节;

例如,如果您有一个包含 100 万个参数的神经网络,并且您使用的是 32 位浮点数,则估计大小:

M o d e l s i z e ( M B ) = N u m b e r o f p a r a m e t e r s × 4 2 20 Model size (MB)= \frac{Number of parameters×4}{2^{20}} Modelsize(MB)=220Numberofparameters×4
,

M o d e l s i z e ( M B ) = 1000000 × 4 1048576 Model size (MB)= \frac{100 0000 ×4}{1048576} Modelsize(MB)=10485761000000×4,

M o d e l s i z e ( M B ) = 3.814 M B Model size (MB)= 3.814MB Modelsize(MB)=3.814MB

在这里插入图片描述

1.4 常用基础模型权重参数

一些基础网络模型可在pytorch 官方查询,

如分类, 分割, 检测任务则去这里查询:

·https://pytorch.org/vision/main/models.html#classification·
点击模型,可以查看具体参数:

在这里插入图片描述

而对于自然语言处理,rnn, Lstm, bert, Transformer 等模型, 则可以到Hugging Face 中查询:

https://huggingface.co/models?sort=trending

在其 Model Card, 或者Files and versions 中 可以查询到 Model size,计算其中的参数,

在这里插入图片描述

2. 测试模型

使用该仓库, 计算各个模型的参数量;
https://github.com/Lyken17/pytorch-OpCounter

pip install thop

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/756058.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue3使用高德地图(3分钟快速上手)

一.、在高德开发平台注册账号 高德开放平台 | 高德地图API (amap.com) 二、我的 > 管理管理中添加Key 三、安装依赖 npm i amap/amap-jsapi-loader --save 四、创建一个放置地图的容器 <template><div class"container"></div> </template…

网工内推 | 信息安全主管,CISP认证优先,最高25K,加绩效提成

01 福建省数字福建云计算运营有限公司 招聘岗位&#xff1a;网络及信息安全主管 职责描述&#xff1a; 1.负责带领IT运维团队&#xff0c;对公司网络与安全整体架构规划&#xff0c;设计、运营及IT设备的全生命周期运维规划等&#xff1b; 2.负责对网络、网络安全的日常运维管…

C++中虚表是什么

定义 虚函数&#xff08;Virtual Function&#xff09; 定义&#xff1a;类中使用virtual 关键字修饰的函数 叫做虚函数 语法&#xff1a; class Base { public:virtual void show() { cout << "Base show" << endl; } }; 虚函数表&#xff08;Virtual…

印刷企业实施MES管理系统如何做好需求分析

在数字化、信息化的大潮中&#xff0c;印刷企业面临着转型升级的迫切需求。MES管理系统作为连接企业资源计划ERP和现场自动化系统的桥梁&#xff0c;对于提升印刷企业的生产效率、优化资源配置、提高产品质量具有重要意义。因此&#xff0c;做好MES管理系统的需求分析&#xff…

多线程(部分)

Day28下2 多线程 一、什么是进程 进程是系统进行资源分配和调用的独立单元&#xff0c;每一个进程都有它的独立内存空间和系统资源。 二、单进程操作系统和多进程操作系统的区别 单进程操作系统&#xff1a;dos&#xff08;一瞬间只能执行一个任务&#xff09; 多进程单用户操…

equals与时间序列攻击

引言 随着信息技术的迅速发展&#xff0c;网络安全和隐私问题变得愈发重要。黑客和攻击者不断寻找新的攻击方法&#xff0c;其中之一是时间序列攻击&#xff08;Timing Attack&#xff09;。时间序列攻击是一种侧信道攻击&#xff0c;攻击者试图通过测量程序的执行时间来推断程…

Vue3语法插件Volar在vsCode中搜不到,Volar正式更名为Vue-Official

问题描述 今天拿Vue3的cli练手&#xff0c;之前用的语法插件是Vue2的Vetur&#xff0c;对于Vue3来说该插件不能完美匹配了&#xff0c;所以就想切换回Volar&#xff0c;结果万万没想到&#xff0c;找不着了&#xff1f;&#xff1f;&#xff1f;&#xff01;&#xff01;&…

git stash clear/drop 后如何恢复

git stash clear/drop 后代码如何恢复 事故经过 切换分支前有修改未提交的代码&#xff0c;使用 git stash 存储了当前的代码切换分支再返回自己开发的分支本来要进行 git stash pop 操作&#xff0c;然后 git stash list 发现有好几个 stash记录于是想清除没用的 stash 记录…

【Linux】进程优先级 命令行参数 环境变量

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 目录 文章目录 前言 一、进程优先级 1.1、进程优先级的基本概念 1.2、优先级 VS 权限 1.3、为什么要有优先级&#xff1f; 1.4、Linux的优先级的特点 && 查看方式 1.…

伦敦金是合法的吗

作为国际黄金市场的代表&#xff0c;“伦敦金”这一术语频繁出现在各类财经报道与投资者交流之中&#xff0c;其合法性始终是投资者关注的核心问题。本文将以“伦敦金是合法的吗&#xff1f;”为主题&#xff0c;全方位剖析伦敦金在全球范围及中国境内的法律地位和投资环境。 “…

代码随想录算法训练营第四十三天|卡码网52. 携带研究材料(第七期模拟笔试)、518. 零钱兑换 II、377. 组合总和 Ⅳ

卡码网52. 携带研究材料&#xff08;第七期模拟笔试&#xff09; 刷题https://kamacoder.com/problempage.php?pid1052文章讲解https://programmercarl.com/%E8%83%8C%E5%8C%85%E9%97%AE%E9%A2%98%E7%90%86%E8%AE%BA%E5%9F%BA%E7%A1%80%E5%AE%8C%E5%85%A8%E8%83%8C%E5%8C%85.…

MySQL关联查询如何优化

好久不见&#xff0c;关于这篇文章&#xff0c;我也是想了很久&#xff0c;还是决定写一篇文章&#xff0c;有很多同学问过 mysql 相关的问题&#xff0c;其实关联查询如何优化&#xff0c;首先我们要知道关联查询的原理是什么&#xff1f; 左连接 left join SELECT 字段列表…

携程Kar98k/hotelUuidKey算法分析

声明 本文以教学为基准、本文提供的可操作性不得用于任何商业用途和违法违规场景。 本人对任何原因在使用本人中提供的代码和策略时可能对用户自己或他人造成的任何形式的损失和伤害不承担责任。 如有侵权,请联系我进行删除。 这里只是我分析的分析过程,以及一些重要点的记录…

【ARM】DS中Coretex-M处理器的常用寄存器介绍

【更多软件使用问题请点击亿道电子官方网站查询】 1、 文档目标 了解ArmDS中Coretex-M处理器的常用寄存器的名称及作用。 2、 问题场景 在对Coretex-M处理器进行开发时&#xff0c;了解常用寄存器的名称及作用&#xff0c;可以&#xff1a; 编写正确的程序: 寄存器是程序员用…

UE4_AI_行为树_行为树快速入门指南

声明&#xff1a;学习笔记。 在 行为树快速入门指南 中&#xff0c;你将学会如何创建一个敌方AI&#xff0c;该AI看到玩家后会做出反应并展开追逐。当玩家离开视线后&#xff0c;AI将在几秒钟后&#xff08;这可根据你的需求进行调整&#xff09;放弃追逐&#xff0c;并在场景中…

使用 Postman 批量发送请求的最佳实践

背景 最近写了几个接口&#xff1a; 获取 books 的接口获取 likes 的接口获取 collections 的接口 但是我还是不放心&#xff0c;因为这些接口到底稳不稳定呢&#xff1f;上线后有没有隐患呢&#xff1f;所以我想做一个批量发送接口模拟~ 但是想要做到批量发送接口&#xf…

考研数学|《基础660》太难了!哪本习题集更适合打基础?

对于基础阶段的学习者来说&#xff0c;推荐使用汤家凤老师的《1800题》。这本题集包含了大量的数学题目&#xff0c;覆盖了考研数学的各个知识点和难度层次。题目设计全面&#xff0c;有助于系统地复习和巩固数学知识。 《1800题》提供了详细的解题思路和答案解析&#xff0c;…

oops-framework框架 之 启动流程(三)

引擎&#xff1a; CocosCreator 3.8.0 环境&#xff1a; Mac Gitee: oops-game-kit 回顾 上篇博客中我们通过 oops-game-kit 模版构建了基础的项目&#xff0c;另外讲解了下assets目录结构和游戏配置文件的基本使用相关&#xff0c;详情内容可参考&#xff1a; oops-framewo…

DevOps工作流程之一:Apipost

随着互联网行业的不断发展&#xff0c;为了提高工作效率&#xff0c;加快软件的交付流程&#xff0c;越来越多企业的选择DevOps工作流程。DevOps旨在通过自动化流程和改善协作&#xff0c;实现软件开发、测试和交付的一体化&#xff0c;从而提高软件交付的质量和速度。而Apipos…

测试面试必备:HTTP请求和响应详解!

一次完整的HTTP请求过程从TCP三次握手建立连接成功后开始&#xff0c;客户端按照指定的格式开始向服务端发送HTTP请求&#xff0c;服务端接收请求后&#xff0c;解析HTTP请求&#xff0c;处理完业务逻辑&#xff0c;最后返回一个HTTP的响应给客户端&#xff0c;HTTP的响应内容同…