DL中的GPU使用问题

DL中的GPU使用问题

news/2025/4/27 2:45:53/文章来源:https://blog.csdn.net/messyking/article/details/134759493

写在前面
在使用GPU进行深度学习训练经常会遇到下面几个问题，这里做一个解决方法的汇总。

🐕Q1🐕：在一个多卡服务器上，指定了cuda:1，但是0号显卡显存还是会被占用一定量的显存。

这个问题很经典的出现场景就是0号卡已经几乎要被占满了，但是1号卡空的很。本想指定在1号卡上跑DL，结果因为一直会占用0号卡一定量的显存，但0号卡此时已经不够显存了，就会反复报：CUDA OUT OF MEMORY.

A1：这个问题是因为模型的部分初始化操作会默认在0号卡上进行，后续的cuda:1没法将这个初试化操作放到1号卡上，所以就占用了部分0号卡的情况。解决的方法可以直接在代码运行的时候指定模型的可见显卡环境。比如现在有一台双卡服务器，现在要将代码指定在1号卡进行，可通过下面代码运行：

CUDA_VISIBLE_DEVICES=1 python3 train.py

其中CUDA_VISIBLE_DEVICES=1的作用是将你的1号显卡暴露给这个代码，这个代码在运行过程中只看到了这张卡，这时候你代码中可以通过调用cuda:0就能够实现只占用这张卡的内存了。另外CUDA_VISIBLE_DEVICES这里指定的顺序也有讲究，如果是如下这样指定：

CUDA_VISIBLE_DEVICES=0,1 python3 train.py

那代码中如果是调用cuda:0的话对应调用的就是0号卡，但如果是按照下面这样指定的话：

CUDA_VISIBLE_DEVICES=1,0 python3 train.py

调用cuda:0的话对应调用的就是1号卡。

🐕Q2🐕：在一个多卡服务器上，想要同时利用多张卡同时训练。

这个一般就是用于模型需要较多显存，但是单卡的显存不够的情况了。

A2：使用如下代码即可：

    if torch.cuda.device_count() > 1:model = nn.DataParallel(model)

注意，在模型分布到多卡上之后，输入数据直接按照下面方式存入显存即可：

input = input.cuda()

数据会进行自适应分流到各个显卡上的。

To be continued…

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/191913.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

甄知黄建华：从“天赋平平”到IT行业“六边形战士”，探索出企业数智化转型的“强IT”之路

甄知黄建华：从“天赋平平”到IT行业“六边形战士”，探索出企业数智化转型的“强IT”之路

本期我们先抛开人物和主体不表，从大环境开始谈起。随着科技的快速发展和全球商业环境的不断变化，中国企业对灵活性、创新性、全球化和效率的需求是迫切的，进行数字化转型来支撑企业的业务变革、组织优化已是业界共识。如何根据企业的实际情况…

阅读更多...

【Element-ui】Element-ui是什么？如何安装

【Element-ui】Element-ui是什么？如何安装

文章目录前言一. 什么是Element UI?二. 安装Element UI2.1 安装方法12.2 安装方法2 三、引入Element3.1 完整引入3.2 按需引入总结前言在Web开发中，使用现成的UI组件库能够极大地提高开发效率。而Element UI（饿了么团队开发的一套基于Vue.js的UI组…

阅读更多...

锐捷EWEB网管系统 RCE漏洞复现

锐捷EWEB网管系统 RCE漏洞复现

0x01 产品简介锐捷网管系统是由北京锐捷数据时代科技有限公司开发的新一代基于云的网络管理软件，以“数据时代创新网管与信息安全”为口号，定位于终端安全、IT运营及企业服务化管理统一解决方案。 0x02 漏洞概述 Ruijie-EWEB 网管系统 flwo.control.ph…

阅读更多...

定时任务特辑 | Quartz、xxl-job、elastic-job、Cron四个定时任务框架对比，和Spring Boot集成实战

定时任务特辑 | Quartz、xxl-job、elastic-job、Cron四个定时任务框架对比，和Spring Boot集成实战

专栏集锦，大佬们可以收藏以备不时之需： Spring Cloud 专栏：http://t.csdnimg.cn/WDmJ9 Python 专栏：http://t.csdnimg.cn/hMwPR Redis 专栏：http://t.csdnimg.cn/Qq0Xc TensorFlow 专栏：http://t.csdni…

阅读更多...

Docker从入门到实战：Docker快速部署、Dockerfile编写、容器间通信及共享数据实战、Docker-compose详解

Docker从入门到实战：Docker快速部署、Dockerfile编写、容器间通信及共享数据实战、Docker-compose详解

文章目录一、基本概念1、体系结构2、容器与镜像1）镜像2）容器a、容器内部结构b、容器生命周期 3、执行流程二、常用命令docker pull 镜像名<:tags> ：从远程仓库抽取镜像docker images：查看本地镜像docker run 镜像名<:t…

阅读更多...

达梦8搭建DataWatch集群

达梦8搭建DataWatch集群

一、集群配置官方文档本次配置集群需要两台服务器主库：dmdw1，10.0.0.100备库：dmdw2，10.0.0.110确认监视器：10.0.0.110普通监视器：10.0.0.100 二、初始化数据库 2.1 主库执行 su - dmdba cd /opt/dmdbm…

阅读更多...

利用Python爬虫爬取豆瓣电影排名信息

利用Python爬虫爬取豆瓣电影排名信息

可以使用第三方库Beautiful Soup和Requests来编写一个简单的爬虫，从豆瓣电影Top100页面获取信息 import requests from bs4 import BeautifulSoupdef get_douban_top100():url https://movie.douban.com/top250headers {User-Agent: Mozilla/5.0 (Windows NT 10.…

阅读更多...

C++11入门

C++11入门

目录 C11简介统一的列表初始化声明范围for循环 STL中一些变化 C11简介在2003年C标准委员会提交了一份技术勘误表(简称TC1).使得C03这个名字取代了C98成为C11之前的最新C标准名称.但由于C03主要是对C98标准中的漏洞进行修复,语言的核心部分则没有改动,因此人们习惯的把…

阅读更多...

给定一组经纬度如何判断某点是否在这组经纬度的范围之内（电子围栏实现代码）

给定一组经纬度如何判断某点是否在这组经纬度的范围之内（电子围栏实现代码）

方法一： 使用JTS Topology Suite 是 Java 的空间数据模型和空间分析操作的库，用于处理地理空间数据和进行空间分析。 1.1引入maven <dependency><groupId>org.locationtech.jts</groupId><artifactId>jts-core</artifactId…

阅读更多...

代数学笔记6: 群同态基本定理,循环群结构定理

代数学笔记6: 群同态基本定理,循环群结构定理

群同态 ρ : G 1 ( , ⋅ ) → G 2 ( , ∘ ) g ↦ ρ ( g ) \rho:G_1(\ ,\cdot)\to G_2(\ ,\circ)\\ \qquad\ \ g\mapsto \rho(g) ρ:G1( ,⋅)→G2( ,∘) g↦ρ(g) ∀ g 1 , g 2 ∈ G \forall g_1,g_2\in G ∀g1,g2∈G, 有 ρ ( g 1 ⋅ g 2 ) ρ ( g 1 ) ∘ ρ ( g 2 …

阅读更多...

解决报错：error: (-215:Assertion failed) inv_scale_x ＞ 0 in function ‘cv::resize‘

解决报错：error: (-215:Assertion failed) inv_scale_x ＞ 0 in function ‘cv::resize‘

需求背景欲使用opencv的resize函数将图像沿着纵轴放大一倍，即原来的图像大小为(384, 512), 现在需要将图像放大为(768, 512)。源码 import cv2 import numpy as np# 生成初始图像 img np.zeros((384, 512), dtypenp.uint8) img[172:212, 32:-32] 255 H, W …

阅读更多...

卷积神经网络-3D医疗影像识别

卷积神经网络-3D医疗影像识别

文章目录一、前言二、前期工作1. 介绍2. 加载和预处理数据二、构建训练和验证集三、数据增强四、数据可视化五、构建3D卷积神经网络模型六、训练模型七、可视化模型性能八、对单次 CT 扫描进行预测一、前言我的环境： 语言环境：Python3.6.5编译器&a…

阅读更多...

题目：DNA序列修正（蓝桥OJ 3904）

题目：DNA序列修正（蓝桥OJ 3904）

题目描述： 解题思路： 从左到右扫描第一条 DNA 序列和第二条 DNA 序列的每一个位置，检查它们是否互补。如果某个位置不互补，我们需要寻找第二条 DNA 序列中后续位置的碱基，看是否可以通过交换使这两个位置都互补。如果…

阅读更多...

〖大前端 - 基础入门三大核心之JS篇㊹〗- DOM事件委托

〖大前端 - 基础入门三大核心之JS篇㊹〗- DOM事件委托

说明：该文属于大前端全栈架构白宝书专栏，目前阶段免费，如需要项目实战或者是体系化资源，文末名片加V！作者：不渴望力量的哈士奇(哈哥)，十余年工作经验, 从事过全栈研发、产品经理等工作&#xf…

阅读更多...

ssl下载根证书和中间证书

ssl下载根证书和中间证书

为了保证客户端和服务端通过HTTPS成功通信，您在安装SSL证书时，也需要安装根证书和中间证书。本文介绍如何获取根证书和中间证书。使用说明如果您的业务用户通过浏览器访问您的Web业务，则您无需关注根证书和中间证书，因为根证书…

阅读更多...

ELK高级搜索，深度详解ElasticStack技术栈-下篇

ELK高级搜索，深度详解ElasticStack技术栈-下篇

前言：ELK高级搜索，深度详解ElasticStack技术栈-上篇 14. search搜索入门 14.1. 搜索语法入门 14.1.1 query string search 无条件搜索所有 GET /book/_search结果： {"took" : 969,"timed_out" : false,"_shar…

阅读更多...

头歌JUnit单元测试相关实验进阶

头歌JUnit单元测试相关实验进阶

JUnit是一个由 Erich Gamma 和 Kent Beck 编写的一个回归测试框架（regression testing framework），主要供 Java 开发人员编写单元测试。Junit在极限编程和重构中被极力推荐使用，因为它可以大大地提高开发的效率。 Junit的特性&…

阅读更多...

Spring——全局异常处理（介绍@RestControllerAdvice和@ExceptionHandler）

Spring——全局异常处理（介绍@RestControllerAdvice和@ExceptionHandler）

目录 1.RestControllerAdviceExceptionHandler的作用2.实现原理3.各种特性 1.RestControllerAdviceExceptionHandler的作用 RestControllerAdvice注解 RestControllerAdvice是Spring框架提供的注解，用于全局异常处理。它将异常处理方法集中在一个类中，…

阅读更多...

力扣66. 加一

力扣66. 加一

文章目录力扣66. 加一示例代码实现总结收获力扣66. 加一示例代码实现 class Solution {public int[] plusOne(int[] digits) {int ndigits.length;for(int in-1;i>0;i--){if(digits[i]!9){digits[i];for(int ji1;j<n;j){digits[j]0;}return digits;}}int[] resnew i…

阅读更多...

selenium环境安装

selenium环境安装

一、下载安装python 下载python安装python设置python环境变量安装selenium （1）下载python 您可以从Python官方网站（https://www.python.org/downloads/）下载Python。在页面上，您将看到不同版本的Python供您选择。根…

阅读更多...

最新文章