huggingface笔记:实例化大模型(Acclerate)

1 访问大模型的一个障碍:内存量

  • 访问非常大的预训练模型的一个障碍是所需的内存量。
  • 当加载预训练的 PyTorch 模型时,通常会:
    • 创建一个随机权重的模型。
    • 您的预训练权重。
    • 将这些预训练权重放入模型中。
  • ——>前两步都需要在内存中有模型的完整版本,如果模型有几十GB的大小,可能没有足够的内存来存放两份副本。

2 Accelerate的解决方法

  • from_pretrained() 方法通过加入 Accelerate 的大模型推理功能得到了增强,有效地处理非常大的模型
  • 大模型推理在 PyTorch 的元设备上创建一个模型框架。只有当预训练权重被加载时,才会创建随机初始化的参数
    • ——>不需要同时在内存中保留两份模型副本(一份是随机初始化的模型,另一份是预训练权重)
    • ——>消耗的最大内存仅为整个模型的大小

要在 Transformers 中启用大模型推理,在 from_pretrained() 方法中设置 low_cpu_mem_usage= True

from transformers import AutoModelmodel=AutoModel.from_pretrained("meta-llama/Llama-2-7b-hf", low_cpu_mem_usage=True)
  • Accelerate 自动地将模型权重分配到所有可用设备上,从最快的设备(GPU)开始,然后转移到较慢的设备(CPU,甚至是硬盘)

  • 当传递 device_map 参数时,low_cpu_mem_usage 会自动设置为 True
    • ——>此时不需要显式指定它

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/20023.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MFC工控项目实例之二添加iPlotx控件

承接专栏《MFC工控项目实例之一主菜单制作》 在WIN10下使用Visual C 6.0 (完整绿色版)添加iPlotx控件的方法。 1、在资源主对话框界面点击鼠标右键如图选择插入Active控件点击进入。 2、选择iPlotx Contrlolh点击确定。 3、在对话框界面插入iPlotx控件。…

emp.dll文件丢失要怎么解决?荒野大镖客emp.dll修复方法分享

软件运行过程中经常遇到各种技术问题,其中之一就是动态链接库(DLL)文件丢失的现象。DLL文件是Windows操作系统中一个重要的组件,它包含运行多个应用程序所需要的代码和数据。因此,一个丢失的DLL文件,如“em…

《逆水寒》手游周年庆,热度不减反增引发热议

易采游戏网5月31日最新消息:随着数字娱乐时代的飞速发展,手游市场的竞争愈发激烈。在这样的大背景下,《逆水寒》手游以其独特的古风武侠世界和深度的社交体验,自上线以来便吸引了无数玩家的目光。如今,这款游戏迎来了它…

对象转为Map

方案一&#xff0c;Jackson String json objectMapperFace.writeValueAsString(contract);Map<String,Object> map objectMapperFace.readValue(json, Map.class);方案二 &#xff0c; apache BeanUtils Map<String,String> beanMap null;try {beanMap BeanUti…

MMrotate报错AttributeError: ‘NoneType‘ object has no attribute ‘shape‘

使用MMrotate训练自定义数据集报错&#xff1a; AttributeError: ‘NoneType’ object has no attribute ‘shape’ 2024-05-31 17:48:06,121 - mmrotate - INFO - workflow: [(train, 1)], max: 12 epochs 2024-05-31 17:48:06,121 - mmrotate - INFO - Checkpoints will be …

记录【KVM更改br0网卡IP后,原来ip地址仍在问题】

问题描述 KVM桥接方式创建的虚拟机&#xff0c;因为修改了ifcfg网卡配置文件导致之前的ip地址仍存在&#xff0c;route -n后&#xff0c;默认网关仍是之前的配置 解决 virt-manager进入控制台 ip addr flush dev 网卡名启动网卡 systemctl start Networkmanager systemctl…

相同的树(oj题)

一、题目链接https://leetcxode-cn.com/problems/same-tree/ 二、题目思路 遍历整颗树&#xff0c;判断两棵树的每个位置的结点都相同。 每个结点的左右孩子结点都要综合判断 三、题解代码 bool isSameTree(struct TreeNode* p, struct TreeNode* q) {//如果两颗树的根结点…

Qt实现窗口失去焦点抖动功能

一、失去焦点检测 当窗口失去焦点时会发出FocusOut事件&#xff0c;具体实现如下&#xff1a; 首先给窗口安装事件过滤器&#xff1a; this->installEventFilter(this);然后在事件过滤器函数中判断有没有失去焦点 bool MessageDialog::eventFilter(QObject *object, QEve…

golang中一个优雅的开发和使用命令行工具的库 cobra

在go语言的命令行工具开发中&#xff0c;我们可以使用go官方的flags来解析用户输入参数实现命令行的开发&#xff0c; 但是如果是有涉及二级命令这类的开发用官方的这个flags就比较麻烦了&#xff0c; 今天给大家介绍一个可用帮助我们快速优雅的开发和使用命令行工具的库cobra&…

汇舟问卷:国外问卷调查两小时赚28美金?

现在的年轻人不愿意打工的原因不只是因为累&#xff0c;而且赚的钱也不多。有些人开玩笑地说&#xff0c;摆个摊儿卖点小商品都比上班赚得多&#xff0c;这确实是事实。 打工只能勉强维持生计&#xff0c;不能致富。因此&#xff0c;如果我们想赚大钱&#xff0c;首先需要改变…

炫云亮相第二十届中国国际动漫节国际动漫游戏商务大会!

5月28日-29日&#xff0c;备受瞩目的第二十届中国国际动漫节国际动漫游戏商务大会(iABC2024)在杭州滨江开元名都大酒店隆重召开&#xff01;本届大会以动漫IP为核心&#xff0c;从源头到全系列数字内容&#xff0c;探索创新协同、融合发展、价值转化&#xff0c;并对重点作品和…

IDEA 常用技巧

1、代码块整体移动 选中&#xff0c;tab整体右移选中&#xff0c;shifttab整体左 移 2、统一修改变量 3.方法分割线 seting >> editor >> apperance >> show method separators 4、快捷键 构造器、set与get方法、方法重写、toString 等快捷操 鼠标停留在…

人工智能在消化道肿瘤中的最新研究【24年五月|顶刊速递·05-31】

小罗碎碎念 2024-05-31|医学AI顶刊速递 今天分享的六篇文章,主题是AI+结肠癌。但是,并非所有的文章都是直接与结直肠癌相关,比如第一篇研究的就是肝癌。 我其实想关注的是消化道肿瘤的医学AI研究——消化道由口腔、食管、胃、小肠、大肠和直肠组成,而肝脏虽然不直接参与食…

java海滨学院班级回忆录源码(springboot)

风定落花生&#xff0c;歌声逐流水&#xff0c;大家好我是风歌&#xff0c;混迹在java圈的辛苦码农。今天要和大家聊的是一款基于springboot的海滨学院班级回忆录。项目源码以及部署相关请联系风歌&#xff0c;文末附上联系信息 。 项目简介&#xff1a; 海滨学院班级回忆录的…

运维开发.Kubernetes探针与应用

运维系列 Kubernetes探针与应用 - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite&#xff1a;http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAddress of this article:https://blog.csdn.net/qq_28550263…

量子计算:未来技术的变革与应用

量子计算&#xff1a;未来技术的变革与应用 引言 量子计算是近年来科学技术领域的一个前沿话题&#xff0c;它有潜力彻底改变我们处理信息的方式。通过利用量子力学的独特性质&#xff0c;量子计算机可以在某些问题上超越传统计算机的性能&#xff0c;带来计算能力的巨大飞跃…

2024 江苏省大学生程序设计大赛 2024 Jiangsu Collegiate Programming Contest(FGKI)

题目来源&#xff1a;https://codeforces.com/gym/105161 文章目录 F - Download Speed Monitor题意思路编程 G - Download Time Monitor题意思路编程 K - Number Deletion Game题意思路编程 I - Integer Reaction题意思路编程 写在前面&#xff1a;今天打的训练赛打的很水&…

电商物流查询解决方案助力提升消费者体验

截至2023年12月&#xff0c;中国网络购物用户规模达9.15亿人&#xff0c;占网民整体的83.8%。这一庞大的数字不仅展现了电子商务的蓬勃发展&#xff0c;也标志着数字零售企业营销战略的转变——从以产品和流量为核心&#xff0c;到用户为王的新阶段。因此&#xff0c;提升消费者…

探索 Android Studio 中的 Gemini:加速 Android 开发的新助力

探索 Android Studio 中的 Gemini&#xff1a;加速 Android 开发的新助力 在 Gemini 时代的下一篇章中&#xff0c;Gemini融入了更多产品中&#xff0c;Android Studio 正在使用 Gemini 1.0 Pro 模型&#xff0c;使 Android 开发变得更快、更简单。 Studio Bot 现已更名为 And…

广告联盟项目:广告收益小游戏app开发

开发一个基于广告联盟项目的广告收益小游戏APP涉及多个关键步骤和考虑因素。以下是一个大致的开发流程和要点&#xff1a; 市场调研与定位&#xff1a; 深入了解目标用户群体&#xff0c;包括他们的游戏偏好、使用习惯以及广告接受度1。 分析市场上类似产品的成功与失败案例&…