Linux配置PyTorch GPU环境

本文是基于系统已经安装了驱动和CUDA的,假如不会安装驱动和CUDA的,可以参考我写的上一篇文章:https://blog.csdn.net/pdc31czy/article/details/136072017?spm=1001.2014.3001.5501

并且本文是基于HPC写的笔记,普通电脑跳过步骤1.

1. 进入GPU节点

[zychen@sms ~]$ ssh gpunode1

2.查看显卡信息

[zychen@gpunode1 ~]$ nvidia-smi

3.查看cuda版本

[zychen@gpunode1 ~]$ nvcc --version
bash: nvcc: command not found…

4.上面显示没有cuda信息,先检查 CUDA 是否已安装,再添加 CUDA 到 PATH:

[zychen@gpunode1 ~]$ export PATH=/usr/local/cuda/bin:$PATH
[zychen@gpunode1 ~]$ export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

5.运行 source ~/.bashrc 来使更改生效

[zychen@gpunode1 ~]$ source ~/.bashrc

6.再次查看 CUDA 编译器的版本信息

[zychen@gpunode1 ~]$ nvcc --version
nvcc: NVIDIA ® Cuda compiler driver
Copyright © 2005-2022 NVIDIA Corporation
Built on Wed_Sep_21_10:33:58_PDT_2022
Cuda compilation tools, release 11.8, V11.8.89
Build cuda_11.8.r11.8/compiler.31833905_0

可以通过上面可知CUDA 编译器版本是 11.8,并且构建于 2022 年 9 月 21 日。因为已经有cuda11.8,现在只需要下载安装anaconda。

7.用wget下载anaconda

https://www.anaconda.com/download/
在这skip register并且找到linux下的下载文件,右键复制下载链接

[zychen@gpunode1 ~]$ cd ~
[zychen@gpunode1 ~]$ mkdir tmp
[zychen@gpunode1 ~]$ cd tmp
[zychen@gpunode1 tmp]$ wget https://repo.anaconda.com/archive/Anaconda3-2024.02-1-Linux-x86_64.sh

ERROR: cannot verify repo.anaconda.com’s certificate, issued by ‘/C=US/O=Let’s Encrypt/CN=E1’:
Issued certificate has expired.
To connect to repo.anaconda.com insecurely, use `–no-check-certificate’.

假如上面显示证书过期问题,根据提示重新用wget下载。

[zychen@gpunode1 tmp]$ wget --no-check-certificate https://repo.anaconda.com/archive/Anaconda3-2024.02-1-Linux-x86_64.sh

8.用bash安装anaconda

[zychen@gpunode1 tmp]$ ls
Anaconda3-2024.02-1-Linux-x86_64.sh

[zychen@gpunode1 tmp]$ bash Anaconda3-2024.02-1-Linux-x86_64.sh
然后就一直按enter,按到出现询问咨询yes or no,输入yes

安装完会询问你是否希望更新你的shell配置文件,以便在启动新的shell会话时自动初始化conda:
Do you wish to update your shell profile to automatically initialize conda?
This will activate conda on startup and change the command prompt when activated.
If you’d prefer that conda’s base environment not be activated on startup,
run the following command when conda is activated:

conda config --set auto_activate_base false

You can undo this by running conda init --reverse $SHELL? [yes|no]

如果你希望conda在启动新的shell会话时自动激活,并且改变命令提示符,你应该输入yes

9.source the .bash-rc file to add Anaconda to your PATH

[zychen@gpunode1 tmp]$ cd ~
[zychen@gpunode1 ~]$ source .bashrc

10.创建虚拟环境

(base) [zychen@gpunode1 ~]$ conda create -n torch39env python=3.9.18
(base) [zychen@gpunode1 ~]$ conda activate torch39env

(torch39env) [zychen@gpunode1 ~]$ python
Python 3.9.18 (main, Sep 11 2023, 13:41:44)
[GCC 11.2.0] :: Anaconda, Inc. on linux
Type “help”, “copyright”, “credits” or “license” for more information.

从上面信息已知已经创建了一个名为torch39env的python为3.9.18的环境,只需要把pytorch相关的包pip到这个环境里就行。按Ctrl+Z退出回到torch39env环境。

11. 安装pytorch:

(torch39env) [zychen@gpunode1 ~]$ pip install torch==2.0.0+cu118 torchvision==0.15.1+cu118 torchaudio==2.0.1+cu118 -f https://download.pytorch.org/whl/cu118/torch_stable.html

12.检查

(torch39env) [zychen@gpunode1 ~]$ python -c "import torch; print(torch.cuda.is_available()); print(torch.version.cuda)"
True
11.8

成功配置PyTorch的环境。其他包比如numpy这些就在这个环境(torch39env)用pip install numpy安装即可。
比如:
(torch39env) [zychen@gpunode1 ~]$ pip install numpy

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/16577.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#读取.sql文件并执行文件中的sql脚本

有些时候我们需要在程序中编写读取sql脚本文件并执行这些sql语句,但是我们在有些时候会遇到读出来的sql语句不能执行,其实不能执行并不是你的sql脚本文件有错误,而是去执行sql语句的时候,C#代码里面执行sql语句的代码对sql里面的一…

低代码与人工智能:改变软件开发的未来

引言 在当今快速发展的科技时代,软件开发行业也在不断地创新和演进。其中,低代码开发和人工智能技术是两个备受关注的领域,低代码开发通过简化开发流程和降低编码难度,使得软件开发变得更加高效和便捷,而人工智能技术…

正宇软件:引领数字人大新纪元,开启甘肃人大代表履职新篇章

在数字化强国的主旋律之下,政府工作的数字化、智能化转型已成为提升治理效能、增强人民满意度的关键一环。在这个大背景下,正宇软件技术开发有限公司以其卓越的技术实力和丰富的行业经验,成为了政府信息化建设的杰出代表。甘肃省人大代表履职…

基于 Wireshark 分析 TCP 协议

一、TCP 协议 TCP(Transmission Control Protocol)是一种面向连接的、可靠的传输层协议。它在网络通信中扮演着重要的角色,用于保证数据的可靠传输。 TCP协议的特点如下: 1. 面向连接:在通信前需要先建立连接&#x…

Hunyuan-DiT环境搭建推理测试

引子 最近鹅厂竟然开源了一个多模态的大模型,之前分享福报厂的多模态视觉大模型(Qwen-VL环境搭建&推理测试-CSDN博客)感兴趣的可以移步。鹅厂开源的,我还是头一回部署。好的,那就让我们看看这个多模态视觉大模型有…

强化学习,第 3 部分:蒙特卡罗方法

文章目录 一、介绍二、关于此文章三、无模型方法与基于模型的方法四、V函数估计4.1 基本概念4.2 V-功能 五、Q 函数估计5.1 V函数概念5.2 优势5.3 Q函数 六、勘探与勘探的权衡七、结论 一、介绍 从赌场到人工智能:揭示蒙特卡罗方法在复杂环境中的强大功能    强化…

企微运营SOP:构建高效、规范的运营流程

随着企业微信在企业内部沟通协作中的广泛应用,如何构建一套高效、规范的企微运营流程成为了众多企业关注的焦点。本文将详细探讨企微运营SOP(Standard Operating Procedure,标准操作程序)的重要性、构建方法以及实施效果&#xff…

zstd库数据压缩与解压缩

在 Visual Studio 2019 中使用 C 的 zstd 库进行数据压缩与解压缩 在今天的博客中,我们将探讨如何在 Visual Studio 2019 中使用 zstd 库进行高效的数据压缩和解压缩。zstd(也称为 Zstandard 或 zstd)是由 Facebook 开发的开源压缩库&#x…

动手学深度学习22 池化层

动手学深度学习22 池化层 1. 池化层2. 实现3. QA 课本: https://zh-v2.d2l.ai/chapter_convolutional-neural-networks/pooling.html 视频: https://www.bilibili.com/video/BV1EV411j7nX/?spm_id_fromautoNext&vd_sourceeb04c9a33e87ceba9c9a2e5f0…

CTF_RE周报(五)

这周感觉题目都开始上难度了,很多题都需要很多的基础知识,也是练到哪学到那,所以刷题的速度还是降了一点 angr符号化执行 上上周就已经遇到了,这周一个buu题也是可以用,就开始学学了,目前还差一半 [WUST…

算法刷题笔记 高精度加法(C++实现)

文章目录 题目描述题目思路和代码 题目描述 给定两个正整数(不含前导0),计算它们的和。 输入格式 共两行,每行包含一个整数。 输出格式 共一行,包含所求的和。 题目思路和代码 基本思路:模拟竖式计算…

关于单元测试

关于单元测试的一些总结:

【408真题】2009-17

“接”是针对题目进行必要的分析,比较简略; “化”是对题目中所涉及到的知识点进行详细解释; “发”是对此题型的解题套路总结,并结合历年真题或者典型例题进行运用。 涉及到的知识全部来源于王道各科教材(2025版&…

618值得买的东西有哪些?买什么最划算?超全品类大清单总结

平日里让许多人心动不已的收藏加购好物,是否常常因为价格昂贵而让人望而却步?然而,618活动期间的到来,恰恰为我们提供了一个难得的购物盛宴!相信在第一波活动中,许多消费者已经跃跃欲试,开始享受…

SuperSocket 自定义AppServer、AppSession、CommandBase

1、预期效果如下图。 2、自定义AppServer,代码如下。 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using SuperSocket.SocketBase; using SuperSocket.SocketBase.Config;namespace Co…

做抖音电商,可以没有货源和经验,但不能没有耐心

我是王路飞。 在抖音做电商这件事,不需要怀疑其可行性。 经过四五年的发展,平台和商家已经证明了抖音电商的前景,它就是我们普通人做抖音最适合的一个渠道。 想在抖音做电商的,再给你们一个经验之谈,你可以没有货源…

linux 查看磁盘使用情况

在Linux系统中,你可以使用以下命令来查看磁盘的情况: 1.df命令:用于显示文件系统的磁盘空间使用情况。 df -h该命令会以人类可读的方式显示文件系统的磁盘空间使用情况,包括文件系统、已用空间、可用空间、已用百分比、挂载点等…

hudi0.13版本clean策略

hudi0.13版本clean策略 在 Apache Hudi 0.13 版本中,清理策略对于数据管理和存储优化起着关键作用。为了确保数据湖的有效利用和性能优化,了解和正确配置清理策略至关重要。以下是 Hudi 0.13 版本的清理策略详细说明及注意事项。 清理策略概述 Hudi 提…

定义字符串报错:ninja: build stopped: subcommand failed.

代码块: char c[] [a,b,c,d,e,\n];报错:ninja: build stopped: subcommand failed.解决: []改成{}

基于 Spring Boot 博客系统开发(十一)

基于 Spring Boot 博客系统开发(十一) 本系统是简易的个人博客系统开发,为了更加熟练地掌握 SprIng Boot 框架及相关技术的使用。🌿🌿🌿 基于 Spring Boot 博客系统开发(十)&#x…