python加载模型包占用内存多大_加载pickle python对象会占用大量内存

python加载模型包占用内存多大_加载pickle python对象会占用大量内存

news/2025/4/5 5:50:03/文章来源:https://blog.csdn.net/weixin_39654322/article/details/110981009

我有一个

python的pickle对象,它生成一个180 Mb的文件.当我取消它时,内存使用量会爆炸到2或3Gb.你有类似的经历吗？这是正常的吗？

对象是包含字典的树：每个边是一个字母,每个节点都是一个潜在的单词.因此,要存储一个单词,您需要的边数与该单词的长度一样多.所以,第一级是最多26个节点,第二个是26 ^ 2,第三个是26 ^ 3等…对于每个节点都是一个单词我有一个属性指向关于单词的信息(动词,名词,定义等…).

我有最多约40个字符的单词.我有大约五十万条款.一切顺利,直到我腌制(使用简单的cpickle转储)：它提供180 Mb文件.

我在Mac OS上,当我取消这些180 Mb时,操作系统会给python进程提供2或3 Gb的“内存/虚拟内存”:(

我没有在这棵树上看到任何递归：边缘的节点本身就是一个数组数组.不涉及递归.

我有点卡住：这些180 Mb的加载大约是20秒(没有谈到内存问题).我不得不说我的CPU不是那么快：核心i5,1.3Ghz.但我的硬盘是ssd.我只有4Gb的内存.

要在我的树中添加这500 000个单词,我会阅读大约7 000个文件,每个文件包含大约100个单词.这个读取使得mac os分配的内存高达15 Gb,主要是在虚拟内存上:(我一直在使用“with”语句确保关闭每个文件,但实际上并没有帮助.阅读文件带走对于40 Ko,0.2秒.对我来说似乎很长.将它添加到树上要快得多(0.002秒).

最后我想创建一个对象数据库,但我猜python并不适合.也许我会去MongoDB 🙁

class Trie():

"""

Class to store known entities / word / verbs...

"""

longest_word = -1

nb_entree = 0

def __init__(self):

self.children = {}

self.isWord = False

self.infos =[]

def add(self, orthographe, entree):

"""

Store a string with the given type and definition in the Trie structure.

"""

if len(orthographe) >Trie.longest_word:

Trie.longest_word = len(orthographe)

if len(orthographe)==0:

self.isWord = True

self.infos.append(entree)

Trie.nb_entree += 1

return True

car = orthographe[0]

if car not in self.children.keys():

self.children[car] = Trie()

self.children[car].add(orthographe[1:], entree)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/311449.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

《C++ Primer》1.52节练习

《C++ Primer》1.52节练习

练习1.23 #include <iostream> #include "Sales_item.h"using namespace std;int main() {Sales_item trans1, trans2;cout << "请输入若干销售记录:" << endl;if (cin >> trans1) {int num 1;while (cin >> trans2)if (t…

阅读更多...

ASP.NET Core 反向代理部署知多少

ASP.NET Core 反向代理部署知多少

引言最近在折腾统一认证中心，看到开源项目[IdentityServer4.Admin：https://github.com/skoruba/IdentityServer4.Admin]集成了IdentityServer4和管理面板，就直接拿过来用了。在尝试Nginx部署时遇到了诸如虚拟目录映射，请求头超长、…

阅读更多...

函数传参string_JavaScript 高阶函数入门浅析

函数传参string_JavaScript 高阶函数入门浅析

原文：https://www.freecodecamp.org/news/a-quick-intro-to-higher-order-functions-in-javascript-1a014f89c6b/译者：jingruzhang校对者：acusp高阶函数高阶函数可以接收函数作为参数，同时也可以返回一个新的函数。高阶函数之所以…

阅读更多...

all()与any()

all()与any()

all():当可迭代对象为空时返回True。或者当可迭代对象中是否所有值都为True，所有值都为True,则返回True。否则返回False。any():当可迭代对象为空时返回False。或者当可迭代对象中是否存在一个为True的值，若存在，返回True,否则返回False 示例…

阅读更多...

《C++ Primer》2.11节练习

《C++ Primer》2.11节练习

练习2.1 练习2.2

阅读更多...

.NET Core开发实战（第13课：配置绑定：使用强类型对象承载配置数据）--学习笔记...

.NET Core开发实战（第13课：配置绑定：使用强类型对象承载配置数据）--学习笔记...

13 | 配置绑定：使用强类型对象承载配置数据要点：1、支持将配置值绑定到已有对象2、支持将配置值绑定到私有属性上继续使用上一节代码首先定义一个类作为接收配置的实例class Config {public string Key1 { get; set; }public bool Key5 { get; set; }pub…

阅读更多...

Python--第3次平时作业

Python--第3次平时作业

目录一、单项选择题二、程序填空题三、所有测试代码如下: 一、单项选择题题号 1 2 3 4 5 6 7 8 9 10 答案 C A A C C D D D D C 题号 11 12 13 14 15 16 17 18 19 20 答案 A A C C B C A C B A 题号 21 22 23 24 25 …

阅读更多...

工业互联网白皮书_发布｜《工业互联网平台安全白皮书（2020）》发布

工业互联网白皮书_发布｜《工业互联网平台安全白皮书（2020）》发布

12月4日，2020年中国工业信息安全大会暨全国工控安全深度行(京津冀站)在北京国际会议中心举行。大会由国家工业信息安全发展研究中心、工业信息安全产业发展联盟主办，以“贯彻总体国家安全观，把牢工控安全基准线”为主题。会上，国家…

阅读更多...

UVA - 514 Rails-栈

UVA - 514 Rails-栈

某城市有一个火车站，铁轨铺设如图6-1所示。有n节车厢从A方向驶入车站，按进站顺序编号为1～n。你的任务是判断是否能让它们按照某种特定的顺序进入B方向的铁轨并驶出车站。例如，出栈顺序(5 4 1 2 3)是不可能的，但(5…

阅读更多...

全局思维

全局思维

在这个复杂多变的时代，是时候提升我们的思维了，树立大局意识，在把握空间纵轴线和时间水平线中思考和谋划大局。全局思维能力，蕴含着从全局的、长远的、战略的高度来分析问题和解决问题的能力；是善于从大处着眼、小处着…

阅读更多...

python中函数的参数类型( 位置参数、关键字参数、默认值参数和可变长度参数)

python中函数的参数类型( 位置参数、关键字参数、默认值参数和可变长度参数)

目录位置参数: 关键字参数: 默认值参数: 可变长度参数: 1.元组可变长度参数 : 2.字典可变长度参数: 附上练习代码: 位置参数: 实参与形参个数完全相同,按位置按顺序将实参传递给形参 def f(x, y):print(x, y) f(2, 3) 2, 3 关键字参数: 在函数调用中使用关键字参数&…

阅读更多...

python分布式存储文件_python如何分布式存储文件的方法

python分布式存储文件_python如何分布式存储文件的方法

想了很久，还是跟大家聊一聊关于分布式吧，只是因为大家在编写代码，填充内容时候，最多肯定是涉及文字以及图片，因此对于这些内容后期做代码存储肯定至关重要，没有任何一个用户会直接看代码来认知你的产品&…

阅读更多...

UVA-11988 悲剧文本-静态链表

UVA-11988 悲剧文本-静态链表

你有一个破损的键盘。键盘上的所有键都可以正常工作，但有时Home键或者End键会自动按下。你并不知道键盘存在这一问题，而是专心地打稿子，甚至连显示器都没打开。当你打开显示器之后，展现在你面前的是一段悲剧的文本。你的任务是在…

阅读更多...

ASP.NET Core Razor 视图预编译、动态编译

ASP.NET Core Razor 视图预编译、动态编译

0x01 前言ASP.NET Core在默认发布情况下，会启动预编译将试图编译成xx.Views.dll,也许在视图中打算修改一处很细小的地方我们需要再重新编译视图进行发布。下面我将从 ASP.NET Core 3 之前版本到 ASP.NET Core 3X 之后版本的一个配置列下下方供大家参考。0x02 预编译…

阅读更多...

最大公约数,最小公倍数,质因式分解

最大公约数,最小公倍数,质因式分解

目录简单代码算出最大公约数,最小公倍数: 辗转相除法得到最大公约数: 两数相乘倒序最小公倍数: 分解质因式, 打印输出, 并且存到列表主程序: 由质因式得到最小公倍数: 简单代码算出最大公约数,最小公倍数: # 最大公约数和最小公倍数 a int(input(please enter 1st num:)…

阅读更多...

群晖python套件包_利用群晖Docker安装ubuntu16.04搭建python网站服务器（部署篇）

群晖python套件包_利用群晖Docker安装ubuntu16.04搭建python网站服务器（部署篇）

在帖子《利用群晖Docker安装ubuntu16.04搭建python网站服务器(安装篇)(地址：http://www.cirdown.com:81/thread-185-1-1.html)》中介绍了在群晖docker中如何安装和配置ubuntu容器，那么服务器系统有了，这篇我们就来讲部署篇，因为我…

阅读更多...

《C++ Primer》2.1.2节练习

《C++ Primer》2.1.2节练习

练习2.3 #include <iostream> using namespace std;int main() {unsigned u 10, u2 42;cout << u2 - u << endl;cout << u - u2 << endl;int i 10, i2 42;cout << i2 - i << endl;cout << i - i2 << endl;cout <…

阅读更多...

从未来看 C#

从未来看 C#

前言如今 C# 虽然发展到了 8.0 版本，引入了诸多的函数式特性，但其实在 C# 未来的规划当中，还有很多足以大规模影响现有 C# 代码结构和组成的特性，本文中将会对就重要的特性进行介绍，并用代码示例展示这些特性。以下特性…

阅读更多...

Python--第1次平时作业

Python--第1次平时作业

目录一、单项选择题二:填空题三:大题代码四:题目五:测试代码一、单项选择题题号 1 2 3 4 5 6 7 8 9 10 答案 D C C D A B A B A C 题号 11 12 13 14 15 16 17 18 19 20 答案 C D D B C B A A D B 题号 21 22 23 2…

阅读更多...

python二级考试怎么报名_全国计算机二级考什么怎么报名

python二级考试怎么报名_全国计算机二级考什么怎么报名

全国计算机二级是很多大学生都要参加的考试，计算机二级的证书含金量还是较高的，那么全国计算机二级主要考的科目有哪些，要怎么报名呢，小编对此进行了整理。计算机二级考哪些科目全国计算机二级可以考的科目如下表，考生…

阅读更多...

最新文章