GPU加速-系统CUDA12.5-Windows10

误区注意

  • 查看当前系统可支持的最高版本cuda:nvidia-smi
    在这里插入图片描述
    • 说明:
      • 此处显示的12.7只是驱动对应的最高版本,不一定是 / 也不一定需要是 当前Python使用的版本。
      • 但我们所安装的CUDA版本需要 小于等于它(即≤12.7)
      • 因此即使我此处显示的是12.7,我依然可以使用12.5的cuda,并不需要卸载再重新安装
  • 可以在CUDA文件夹下查看,电脑是否安装了多个版本CUDA(多版本CUDA,可能是 “ pytorch找不到匹配,从而发生错误 ” 的原因之一)
    • 可以通过找NVIDIA GPU Computing Toolkit文件夹,找到CUDA安装路径,从而查看电脑里安装了几个CUDA(再次注意,上面的12.7并不属于其中一个。安装了几个版本CUDA只看这个文件夹里有几个即可)
    • 比如我的电脑只有一个12.5版本的CUDA在这里插入图片描述

安装CUDA Toolkit(即CUDA)

  • 之前从没安装过CUDA的,可以参考如下过程。
    • 该部分内容是整合如下两篇博文的,因为我之前已经安装了,但没有一步步记录。
    • 本来是想直接附这俩博文链接,但单看它俩是有缺漏的,所以我把它们结合整理一下,看着比较方便。
  • 1、先根据这篇文章完成基础的CUDA安装,但要注意如下提示。
    • 参考博文1:基础CUDA安装(缺少安装后的一些工作)
    • 提示①:3.2中的安装路径可以不默认C盘,以免占据太大空间(但你要记住安装路径,后续添加系统环境变量时要用)
    • 提示②:3.5中取消勾选Visual Studio是由于若系统未安装VS,勾选后会出错。但如果已安装VS,则可以勾选。
    • 提示③:在4中,若命令窗口输入nvcc -V没有显示不必担心,可能是因为该博文缺少了添加环境变量的步骤,此时点开下面第二个博文链接。
  • 2、接着跟着博文2的步骤2~5完成cuDNN和pytorch-gpu的安装(其中涉及CUDA Toolkit的安装在博文1中已安装,可跳过)
    • 参考博文2:安装后续讲得比较清楚完整
    • 提示①:在3中的虚拟环境Python可安装3.8版,不是一定3.11
    • 提示②:虽然我安装的是CUDA12.5,没有直接匹配的pytorch12.5,但可以安装pytorch12.4
    • 提示③:pytorch-gpu若文件太大(一般都几个G),可以直接在官网或者网络的其他渠道下载到whl文件后 → 进入虚拟环境 → 直接pip install (whl文件名),能比较快一点。比如:
      • 我安装时嫌2G多太慢,就直接点开*.whl链接,用另一个有线网电脑几分钟下载后(或者也可以找其他渠道下载到同名文件),总之把whl文件放在本地在这里插入图片描述
      • (记得切换到虚拟环境下后),再直接pip安装即可。
        在这里插入图片描述
      • 如上安装了torch后,还要安装俩小的,直接再输入命令即可:
        在这里插入图片描述

使用加速

  • 根据博文2的步骤5中torch.cuda.is_available()结果显示True后,即可开始训练了。
  • 开另个窗口输入nvidia-smi后:
    • CUDA 版本(驱动支持): 12.7(但我的 PyTorch 是 cu124 版本,CUDA可向下兼容)
    • 可以查看当前的内存使用:1970MiB / 6144MiB → 表示当前 Python 程序大约使用了 2GB 显存
      在这里插入图片描述
    • 也可显示正在使用GPU的进程,与其指向的虚拟环境在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/80589.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

IOT项目——DIY 气象站

开源项目:ESP32 气象站 作者:GiovanniAggiustatutto 原文链接:原文 开源项目:太阳能 WiFi 气象站 V4.0 作者:opengreenenergy 原文链接:原文 DIY 气象站 简介1-制版2-物料 温度设备塔风向标风速计雨量计框…

5G助力智慧城市的崛起——从概念到落地的技术实践

5G助力智慧城市的崛起——从概念到落地的技术实践 引言:智慧城市中的“隐形脉络” 随着城市化的快速推进,传统的城市管理方式已经难以满足人口增长和资源优化的需求。智慧城市的概念应运而生,通过技术创新实现智能化、可持续发展的城市生态…

【Linux】web服务器的部署和优化

目录 nginx的安装与启用--/usr/share/nginx/html默认发布目录 nginx的主配置文件--/etc/nginx/nginx_conf nginx的端口 nginx默认发布文件--index.html nginx默认发布目录 nginx的访问控制 基于IP地址的访问控制 基于用户认证的访问控制 nginx的虚拟主机--/etc/nginx/…

结合五层网络结构讲一下用户在浏览器输入一个网址并按下回车后到底发生了什么?

文章目录 实际应用第一步:用户在浏览器输入 www.baidu.com 并按下回车1. 浏览器触发域名解析(DNS查询) 第二步:DNS请求的逐层封装与传输1. 应用层(DNS协议)2. 传输层(UDP协议)3. 网络…

深入理解N皇后问题:从DFS到对角线优化

N皇后问题是一个经典的算法问题,要求在NN的棋盘上放置N个皇后,使得它们互不攻击。本文将全面解析该问题的解法,特别聚焦于DFS算法和对角线优化的数学原理。 问题描述 在NN的国际象棋棋盘上放置N个皇后,要求: 任意两个…

Java面试场景篇:分布式锁的实现与组件详解

互联网大厂Java求职者面试:分布式锁的实现与组件 在一场紧张而又充满挑战的面试中,Java架构师马架构正面对着一位经验丰富的面试官。以下是他们之间关于分布式锁实现方式及相关问题的对话。 第一轮提问 面试官:请介绍一下分布式锁的概念。…

关于使用 读光-文字检测-DBNet行检测模型-中英-通用领域,版本问题

关于使用 读光-文字检测-DBNet行检测模型-中英-通用领域,版本问题 pip install modelscopeSuccessfully installed certifi-2025.4.26 charset-normalizer-3.4.1 colorama-0.4.6 idna-3.10 modelscope-1.25.0 requests-2.32.3 tqdm-4.67.1 urllib3-2.4.0 pip insta…

刷刷刷刷刷RCE

云曦历年考核 25年春开学考 RCCCE 开启题目进行代码审计 GET传参传入一个参数cmd&#xff0c;但对参数内容给了黑名单进行过滤 $blacklist /bash|nc|wget|ping|ls|cat|more|less|phpinfo|base64|echo|php|python|mv|cp|la|\-|\*|"|\>|\<|\%|\$/i; ls、cat等都…

2024江西ICPC部分题解

题目列表 A - Maliang Learning PaintingC - LiarG - Multiples of 5H - ConvolutionJ - Magic MahjongK - Magic Tree A - Maliang Learning Painting 题目来源&#xff1a;A - Maliang Learning Painting 思路分析 这是个签到题&#xff0c;直接输出abc即可 #include<b…

Pytorch图像数据转为Tensor张量

PyTorch的所有模型&#xff08;nn.Module&#xff09;都只接受Tensor格式的输入&#xff0c;所以我们在使用图像数据集时&#xff0c;必须将图像转换为Tensor格式。PyTorch提供了torchvision.transforms模块来处理图像数据集。torchvision.transforms模块提供了一些常用的图像预…

为什么vllm能够加快大模型推理速度?

vLLM加速大模型推理的核心技术原理可分解为以下关键创新点&#xff1a; 一、‌内存管理革命&#xff1a;PagedAttention‌ KV Cache分页机制‌ 将传统连续存储的KV Cache拆分为非连续内存页&#xff0c;类似操作系统内存分页管理&#xff0c;消除内存碎片并实现动态分配。13B…

第十一章 多态

多态是面向对象开发过程中一个非常重要的概念。 11.1 多态概述 11.1.1 什么是多态 多态&#xff08;polymorphism&#xff09;&#xff0c;从字面理解是“多种形态&#xff0c;多种形式”&#xff0c;是一种将不同的特殊行为泛化为当个特殊记号的机制。 多态从实现的角度可划…

RNN——循环神经网络

一.基本结构 1.目标&#xff1a;处理序列数据&#xff08;时间序列&#xff0c;文本&#xff0c;语音等&#xff09;&#xff0c;捕捉时间维度上的依赖关系 核心机制&#xff1a;通过隐藏状态&#xff08;hidden State&#xff09;传递历史信息&#xff0c;每个时间步的输入包…

性能提升手段--池化技术

看到hadoop代码里有ByteBufferPool,使用池子来避免频繁创建、销毁ByteBuffer,减轻GC压力,提高性能。 顺便总结一下池化技术 一、什么是池化技术?​​ ​​池化(Pooling)​​ 是一种资源管理策略,通过​​预先创建并复用资源​​(如数据库连接、线程、内存对象等)来提…

数据安全和合规性市场分析

一、什么是数据安全和合规性 在数据安全和合规性方面&#xff0c;存在着一系列重要的法律、法规和行业标准&#xff0c;这些规定了组织如何收集、存储、处理和保护个人数据及其他敏感信息。企业之所以要遵守这些规定&#xff0c;是出于多方面的考量&#xff0c;既有法律责任&a…

【每日八股】复习计算机网络 Day4:TCP 协议的其他相关问题

文章目录 昨日内容复习已经建立了 TCP 连接&#xff0c;客户端突然出现故障怎么办&#xff1f;什么时候用长连接&#xff1f;短连接&#xff1f;TCP 的半连接队列与全连接队列&#xff1f;什么是 SYN 攻击&#xff1f;如何避免&#xff1f;TIME_WAIT 的作用&#xff1f;过多如何…

React:<></>的存在是为了什么

1. <></> 是什么&#xff1f; <></> 是 React 的Fragment&#xff08;片段&#xff09;语法糖&#xff0c;等价于 <React.Fragment></React.Fragment>。 2. 它的作用 主要作用&#xff1a; 允许你在组件里返回多个元素&#xff0c;而不需…

cron定时任务

cron定时任务 一、Cron表达式的定义 基础结构 Cron表达式是由空格分隔的6或7个字段组成的字符串&#xff0c;格式为&#xff1a; 秒 分 时 日 月 星期 [年]其中&#xff0c;年通常可以被省略 字段说明&#xff1a; 秒&#xff08;0-59&#xff09; 秒字段表示每分钟的哪一…

分布式之易混淆概念

昨天写UE写的破防了&#xff0c;忘了写文章&#xff0c;今天补一下分布式的一些概念。&#x1f61a; 在软件架构领域&#xff0c;微服务、领域驱动设计&#xff08;DDD&#xff09;和分布式系统是三个高频且容易被混淆的概念。许多开发者误以为它们是“同一件事的不同说法”&a…

量子跃迁:Vue组件安全工程的基因重组与生态免疫(完全体终局篇)

开篇数字免疫系统的范式革命 在2025年某国际金融峰会期间&#xff0c;黑客组织利用量子计算技术对全球37个交易系统发起协同攻击。传统安全组件在2.7秒内集体失效&#xff0c;造成每秒超18亿美元的交易漏洞。这场数字"切尔诺贝利"事件促使我们重新定义前端安全——组…