深度学习模型参数的计算

深度学习模型参数的计算

news/2025/7/13 17:04:58/文章来源:https://blog.csdn.net/chumingqian/article/details/136818109

1. 模型尺寸与参数量

根据神经网络模型中的参数数量估计模型体积的大小涉及多个考虑因素，包括参数的数据类型、每种数据类型的存储要求以及存储模型结构或元数据的任何额外开销。下面是估计模型大小的一般方法：

1.1.数据类型

神经网络参数通常存储为浮点数（例如，32 位浮点数）。但是，某些模型可能会使用较低精度的格式，例如 16 位浮点数，甚至是 8 位整数来量化模型。

存储要求：确定所选数据类型的存储要求。例如：

32-bit floats:.32 位浮点数：每个参数需要 4 个字节的存储空间。
16-bit floats:16 位浮点数：每个参数需要 2 个字节的存储空间。
8-bit integers: .8 位整数：每个参数需要 1 个字节的存储空间。

参数量：计算神经网络模型中的参数总数。这包括所有层的权重和偏差。

1.2 计算模型大小

.计算大小：将参数数量乘以所选数据类型的存储要求，得到模型的总大小（以字节为单位）。

Model size (bytes)=Number of parameters×Storage per parameter (bytes)

记住，这是一个基本估计值，实际大小可能会因模型压缩技术、稀疏表示以及存储模型结构或元数据所需的任何额外开销等因素而有所不同。

例如，如果您有一个包含 100 万个参数的神经网络，并且您使用的是 32 位浮点数，则估计大小：

Model size=1,000,000×4 bytes=4,000,000 bytes

1.3 转换成以M 为单位

当然，如果您的模型以 32 位浮点格式存储，并且您希望以兆字节（MB）为单位表示大小，则可以使用以下步骤：

确定神经网络模型中的参数数。
将参数数乘以每个参数的存储（32 位浮点数为 4 个字节）。
将结果除以 $2^{20}$ 将字节转换为兆字节;

例如，如果您有一个包含 100 万个参数的神经网络，并且您使用的是 32 位浮点数，则估计大小：

$\frac{Number of parameters×4}{2^{20}}$
,

$\frac{100 0000 ×4}{1048576}$ ,

$M o d e l s i ze (MB) = 3.814 MB$

在这里插入图片描述

1.4 常用基础模型权重参数

一些基础网络模型可在pytorch 官方查询，

如分类，分割，检测任务则去这里查询：

·https://pytorch.org/vision/main/models.html#classification·
点击模型，可以查看具体参数：

在这里插入图片描述

而对于自然语言处理，rnn, Lstm, bert, Transformer 等模型，则可以到Hugging Face 中查询：

https://huggingface.co/models?sort=trending

在其 Model Card, 或者Files and versions 中可以查询到 Model size，计算其中的参数，

在这里插入图片描述

2. 测试模型

使用该仓库，计算各个模型的参数量；
https://github.com/Lyken17/pytorch-OpCounter

pip install thop

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/756058.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Vue3使用高德地图（3分钟快速上手）

Vue3使用高德地图（3分钟快速上手）

一.、在高德开发平台注册账号高德开放平台 | 高德地图API (amap.com) 二、我的 > 管理管理中添加Key 三、安装依赖 npm i amap/amap-jsapi-loader --save 四、创建一个放置地图的容器 <template><div class"container"></div> </template…

阅读更多...

高效日志为服务器保驾护航

高效日志为服务器保驾护航

1.游戏日志的重要性日志，无论是对于开发环境，还是生产环境，都有着非常重要的作用，具体如下：跟踪和记录应用程序的运行状态，以便进行故障排查和问题定位。提供应用程序的运行性能数据，以便优化和改进应用程序的性能。收集用户行为和反馈，以便进行用户行为分析和用户体…

阅读更多...

2024-03-19 事业-代号s-商城系统-记录

2024-03-19 事业-代号s-商城系统-记录

摘要: 2024-03-19 事业-代号s-商城系统-记录商城系统: BeikeShop官网 | 免费开源跨境电商建站 Laravel Ecommerce Laravel Shop BeikeShop商城多语言商城多货币商城 100%全开源 ChatGPT OpenAI B2C商城系统 H5商城 PHP商城系统商城源码 PC商城跨境电商系统跨境商城系统 …

阅读更多...

网工内推 | 信息安全主管，CISP认证优先，最高25K，加绩效提成

网工内推 | 信息安全主管，CISP认证优先，最高25K，加绩效提成

01 福建省数字福建云计算运营有限公司招聘岗位：网络及信息安全主管职责描述： 1.负责带领IT运维团队，对公司网络与安全整体架构规划，设计、运营及IT设备的全生命周期运维规划等； 2.负责对网络、网络安全的日常运维管…

阅读更多...

C++中虚表是什么

C++中虚表是什么

定义虚函数（Virtual Function） 定义：类中使用virtual 关键字修饰的函数叫做虚函数语法： class Base { public:virtual void show() { cout << "Base show" << endl; } }; 虚函数表（Virtual…

阅读更多...

印刷企业实施MES管理系统如何做好需求分析

印刷企业实施MES管理系统如何做好需求分析

在数字化、信息化的大潮中，印刷企业面临着转型升级的迫切需求。MES管理系统作为连接企业资源计划ERP和现场自动化系统的桥梁，对于提升印刷企业的生产效率、优化资源配置、提高产品质量具有重要意义。因此，做好MES管理系统的需求分析&#xff…

阅读更多...

【TCP/IP】【调试】Windows系统下，双网卡如何配置静态路由，实现同时访问内外网

【TCP/IP】【调试】Windows系统下，双网卡如何配置静态路由，实现同时访问内外网

🐚作者简介：花神庙码农（专注于Linux、WLAN、TCP/IP、Python等技术方向）🐳博客主页：花神庙码农 ，地址：https://blog.csdn.net/qxhgd🌐系列专栏：TCP/IP协议&…

阅读更多...

多线程（部分）

多线程（部分）

Day28下2 多线程一、什么是进程进程是系统进行资源分配和调用的独立单元，每一个进程都有它的独立内存空间和系统资源。二、单进程操作系统和多进程操作系统的区别单进程操作系统：dos（一瞬间只能执行一个任务） 多进程单用户操…

阅读更多...

面试宝典：MySQL 索引优化

面试宝典：MySQL 索引优化

在数据库的世界里，索引是提升查询效率的关键。对于高级开发者来说，理解并能够优化MySQL索引是提升应用性能的重要技能。本文将深入探讨MySQL索引的原理、类型以及优化策略，帮助你在面试中脱颖而出。索引的基本原理 MySQL中的索引基于B+树（Balanced Tree）数据结构，它提…

阅读更多...

equals与时间序列攻击

equals与时间序列攻击

引言随着信息技术的迅速发展，网络安全和隐私问题变得愈发重要。黑客和攻击者不断寻找新的攻击方法，其中之一是时间序列攻击（Timing Attack）。时间序列攻击是一种侧信道攻击，攻击者试图通过测量程序的执行时间来推断程…

阅读更多...

Vue3语法插件Volar在vsCode中搜不到，Volar正式更名为Vue-Official

Vue3语法插件Volar在vsCode中搜不到，Volar正式更名为Vue-Official

问题描述今天拿Vue3的cli练手，之前用的语法插件是Vue2的Vetur，对于Vue3来说该插件不能完美匹配了，所以就想切换回Volar，结果万万没想到，找不着了？？？！！&…

阅读更多...

git stash clear/drop 后如何恢复

git stash clear/drop 后如何恢复

git stash clear/drop 后代码如何恢复事故经过切换分支前有修改未提交的代码，使用 git stash 存储了当前的代码切换分支再返回自己开发的分支本来要进行 git stash pop 操作，然后 git stash list 发现有好几个 stash记录于是想清除没用的 stash 记录…

阅读更多...

【Linux】进程优先级命令行参数环境变量

【Linux】进程优先级命令行参数环境变量

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档目录文章目录前言一、进程优先级 1.1、进程优先级的基本概念 1.2、优先级 VS 权限 1.3、为什么要有优先级？ 1.4、Linux的优先级的特点 && 查看方式 1.…

阅读更多...

伦敦金是合法的吗

伦敦金是合法的吗

作为国际黄金市场的代表，“伦敦金”这一术语频繁出现在各类财经报道与投资者交流之中，其合法性始终是投资者关注的核心问题。本文将以“伦敦金是合法的吗？”为主题，全方位剖析伦敦金在全球范围及中国境内的法律地位和投资环境。 “…

阅读更多...

【0273】深入分析 relcache（relation descriptor cache）初始化第一阶段

【0273】深入分析 relcache（relation descriptor cache）初始化第一阶段

1. 前言本文是《【0264】深入分析relcache（relation descriptor cache）缓存初始化第2阶段》的前传。在该文中，我们得知PG内核初始化relcache时，一共有三个阶段：阶段（1） RelationCacheInitialize()阶段（2） RelationCacheInitializePhase2()阶段（3） RelationCache…

阅读更多...

代码随想录算法训练营第四十三天|卡码网52. 携带研究材料（第七期模拟笔试）、518. 零钱兑换 II、377. 组合总和 Ⅳ

代码随想录算法训练营第四十三天|卡码网52. 携带研究材料（第七期模拟笔试）、518. 零钱兑换 II、377. 组合总和 Ⅳ

卡码网52. 携带研究材料（第七期模拟笔试） 刷题https://kamacoder.com/problempage.php?pid1052文章讲解https://programmercarl.com/%E8%83%8C%E5%8C%85%E9%97%AE%E9%A2%98%E7%90%86%E8%AE%BA%E5%9F%BA%E7%A1%80%E5%AE%8C%E5%85%A8%E8%83%8C%E5%8C%85.…

阅读更多...

MySQL关联查询如何优化

MySQL关联查询如何优化

好久不见，关于这篇文章，我也是想了很久，还是决定写一篇文章，有很多同学问过 mysql 相关的问题，其实关联查询如何优化，首先我们要知道关联查询的原理是什么？ 左连接 left join SELECT 字段列表…

阅读更多...

SpringBoot+定时器

SpringBoot+定时器

定时器 1.定时器的多种实现1.1 Timer TimerTask)1.2 ScheduledExecutorService 1.定时器的多种实现 JDK自带的Timer TimerTask 优点: 简单易用, 支持延迟执行和周期性执行任务缺点: 在多线程环境下存在问题, 例如任务执行时间较长, 可能会影响其他任务的执行不适合在需要精…

阅读更多...

携程Kar98k/hotelUuidKey算法分析

携程Kar98k/hotelUuidKey算法分析

声明本文以教学为基准、本文提供的可操作性不得用于任何商业用途和违法违规场景。本人对任何原因在使用本人中提供的代码和策略时可能对用户自己或他人造成的任何形式的损失和伤害不承担责任。如有侵权，请联系我进行删除。这里只是我分析的分析过程，以及一些重要点的记录…

阅读更多...

SpringBoot的 ResponseEntity类讲解(具体讲解返回给前端的一些事情)

SpringBoot的 ResponseEntity类讲解(具体讲解返回给前端的一些事情)

概述：ResponseEntity是Spring框架中的一个类，用于封装HTTP响应的相关信息，包括状态码、响应头和响应体。它通常用于控制器方法中返回一个包含特定数据的HTTP响应。 ResponseEntity ResponseEntity类的主要特点如下： 可以自定义H…

阅读更多...

最新文章