【Python】科研代码学习：十三 Accelerate

Accelerate
- 统一的加速接口
- 修改训练代码 (torch.nn)
- 更简单的使用

Accelerate

【HF官网-Doc-Accelerate：API】
HF Accelerate 是一个库，能够让 PyTorch 代码添加几行代码之后，就能在分布式配置中运行（比如多Gpus卡）
前言：建议 Python3.8+
pip install accelerate

统一的加速接口

对任意给定的训练框架 deepspeed / FSDP 等，都提供了一个统一的加速接口。
首先可以执行如下命令，它会在 Accelerates 缓存文件夹中，创建一个 default_config.yaml 文件。它存储训练环境的配置。

accelerate config

在配置好环境后，可以使用 accelerate test 来测试分布式环境。
然后就可以调用如下命令，加速代码了

accelerate launch path_to_script.py --args_for_the_script

修改训练代码 (torch.nn)

我们在代码中需要少数代码的修改
主要是实例化一个 accelerator 加速器，修改 device，对 model, optimizer, dataloader, scheduler 做一个处理，还有反向传播。
注意看下面删除的两行和增加的其他行。

+ from accelerate import Accelerator
+ accelerator = Accelerator()+ device = accelerator.device
+ model, optimizer, training_dataloader, scheduler = accelerator.prepare(
+     model, optimizer, training_dataloader, scheduler
+ )for batch in training_dataloader:optimizer.zero_grad()inputs, targets = batch
-     inputs = inputs.to(device)
-     targets = targets.to(device)outputs = model(inputs)loss = loss_function(outputs, targets)
+     accelerator.backward(loss)optimizer.step()scheduler.step()

更简单的使用

(从学长那里听来的)
貌似加速库很麻烦，要改很多代码，比如如何制定哪几张卡作为 Trainer 训练呢？
我们只要使用 deepspeed + Accelerate，这两个工具即可
首先，这两个环境都安装一下
然后，在 .sh 文件中，直接增加环境变量
注意，CUDA_DEVICE_ORDER 这里不能加双引号；右侧可加可不加；等号左右不能有空格

export CUDA_DEVICE_ORDER="PCI_BUS_ID"
export CUDA_VISIBLE_DEVICES="1,2"

然后直接

accelerate launch --config_file configs/deepspeed_train_config.yaml\run_python_code.py

即可，里面的代码就无需修改了。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/744888.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

【Python】科研代码学习：十三 Accelerate

【Python】科研代码学习：十三 Accelerate

Accelerate

统一的加速接口

修改训练代码 (torch.nn)

更简单的使用

相关文章

【Javascript】 Promise 对象（一）

美摄科技对抗网络数字人解决方案

Python环境搭建 -- Python与PyCharm安装

【Flink SQL】Flink SQL 基础概念：SQL 的时间属性

学习Unity到什么程度可以找工作？

服务器将动态IP设置成静态IP(内部网络)

Excel小技巧（3） - 如何取整

【string一些函数用法的补充】

REDHAWK——组件

LeetCode hot100-10

【DAY09 软考中级备考笔记】机组：信息加密，系统可靠性

es 聚合操作（二）

C语言—求最大公约数（4种算法思路）

“禁止互撕”新规第二天，热搜把#章子怡“怒怼”网友#推上了榜一

1456.定长子串中元音的最大数目

无源性指数

qiankun：vite/webpack项目配置

3.1_8 两级页表

QT5.14.2 探索QT的神秘力量：轻松获取MD5值的秘诀

第三方 cookie 就快被废弃了，再不玩就没机会了！