nccl2安装指南

https://developer.nvidia.com/nccl/nccl-download
旧版本安装:
https://developer.nvidia.com/nccl/nccl-legacy-downloads

找到你对应的CUDA版本
在这里插入图片描述
我这里选择 deb 文件安装了

在这里插入图片描述

sudo dpkg -i nccl-local-repo-ubuntu2004-2.16.5-cuda11.8_1.0-1_amd64.deb

在这里插入图片描述

sudo cp /var/nccl-local-repo-ubuntu2004-2.16.5-cuda11.8/nccl-local-7EEFD2A2-keyring.gpg /usr/share/keyrings/

这一步是将NCCL本地仓库的GPG密钥复制到系统的密钥环目录(/usr/share/keyrings/)中。GPG(GNU Privacy Guard)密钥用于验证下载软件包的完整性和真实性,确保软件包没有被篡改,并且确实来自指定的源。

在安装来自第三方仓库的软件时,APT(Advanced Package Tool)需要这个仓库的GPG密钥来验证软件包。如果没有相应的GPG密钥,APT无法确认软件包的安全性,因此不会安装这些软件包。

具体到这一步骤,nccl-local-7EEFD2A2-keyring.gpg是NVIDIA为其NCCL(NVIDIA Collective Communications Library)本地APT仓库提供的GPG密钥。通过复制这个密钥文件到/usr/share/keyrings/目录,您在使用APT安装NCCL软件包时,APT就能验证软件包的真实性。


由于目前还没有安装 nccl, 用以下命令验证一下:

sudo updatedb  # 更新locate数据库,可能需要一点时间
locate libnccl.so

可以看到没有什么输出

刚通过 dpkg 安装了一个 NCCL 的本地仓库包。
接下来,需要从该本地仓库中安装NCCL
需要更新APT的源列表,然后安装NCCL。这里是一般的步骤:

sudo apt update

于是执行

sudo apt install libnccl2 libnccl-dev

之后定位以下这个玩意儿安装到哪里了:

locate libnccl.so

在这里插入图片描述
OK成功安装

如果你是装给多卡机器装Paddle, 接下来可以执行:

python -c "import paddle; paddle.utils.run_check()"

在这里插入图片描述


我的三台服务器中有一台:
在这里插入图片描述
MD,懒得折腾了,这机子不用nccl2也罢…

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/702949.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用 React 和 MUI 创建多选 Checkbox 树组件

在本篇博客中,我们将使用 React 和 MUI(Material-UI)库来创建一个多选 Checkbox 树组件。该组件可以用于展示树形结构的数据,并允许用户选择多个节点。 前提 在开始之前,确保你已经安装了以下依赖: Reac…

政安晨:【机器学习基础】(二)—— 评估机器学习模型改进

根据前面我的文章看来,咱们只能控制可以观察到的东西。因为您的目标是开发出能够成功泛化到新数据的模型,所以能够可靠地衡量模型泛化能力是至关重要的,咱们这篇文章将正式介绍评估机器学习模型的各种方法。 政安晨的个人主页:政安…

Hikvision SPON IP网络对讲广播系统命令执行漏洞

声明 本文仅用于技术交流,请勿用于非法用途 由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,文章作者不为此承担任何责任。 1.漏洞描述 Hikvision Intercom Broadcasting System是中国海康威视&a…

低功耗设计——门控时钟

1. 前言 芯片功耗组成中,有高达40%甚至更多是由时钟树消耗掉的。这个结果的原因也很直观,因为这些时钟树在系统中具有最高的切换频率,而且有很多时钟buffer,而且为了最小化时钟延时,它们通常具有很高的驱动强度。此外&…

Leetcode 第 124 场双周赛题解

Leetcode 第 124 场双周赛题解 Leetcode 第 124 场双周赛题解题目1:3038. 相同分数的最大操作数目 I思路代码复杂度分析 题目2:3039. 进行操作使字符串为空思路代码复杂度分析 题目3:3040. 相同分数的最大操作数目 II思路代码复杂度分析 题目…

leetcode hot100 买卖股票最佳时机3

本题中,依旧可以采用动态规划来进行解决,之前的两个题我们都是用二维数组dp[i][2]来表示的,其中i表示第i天,2表示长度为2,其中0表示不持有,1表示持有。 本题中,说至多完成两笔交易,也…

C++ 设计模式:工厂模式

工厂模式是一种创建型设计模式,通过封装对象的创建过程,提高代码的可维护性、可扩展性,并实现对象的创建与使用的解耦。 简单工厂模式: 提供一个工厂类,根据传入的参数来决定创建哪种产品类的实例。这种模式不符合开闭…

从零开始学HCIA之WLAN基础02

1、CAPWAP是无线接入点的控制与配置协议,用以支持大规模WLAN组网,同时实现多厂商AC和AP间互通。 2、CAPWAP协议主要功能包括: (1)实现 AP对 AC的自动发现及 AP和 AC的状态机运行与维护; (2&a…

【JS运算符/表达式】`?.` `??` `...` `,` `=` `||=` `?:`等运算符讲解

运算符&#xff1a;除了以下demo代码的内容&#xff0c;其他不常用的就不写了 // 常用运算符&#xff1a; // 最常用的 - * / > < > < && || 就不说了// 取余 % console.log(10 % 3); // 1// 加法赋值运算符 // let a 1; // console.log((a 10)); //…

力扣--动态规划1027.最长等差数列

思路分析&#xff1a; 使用动态规划的思想&#xff0c;定义二维数组dp&#xff0c;其中dp[i][j]表示以nums[i]为结尾&#xff0c;公差为(j-1000)的等差数列长度。为了适应负数的情况&#xff0c;将公差的范围设为[-1000, 1000]&#xff0c;并且加上1000作为数组索引。 初始化r…

Sentinel 注解支持

一、注解支持 Sentinel 提供了 SentinelResource 注解用于定义资源&#xff0c;并提供了 AspectJ 的扩展用于自动定义资源、处理 BlockException 等。使用 Sentinel Annotation AspectJ Extension 的时候需要引入以下依赖&#xff1a; <dependency><groupId>com.…

11:日志分析系统ELK|Elasticsearch|kibana

日志分析系统ELK&#xff5c;Elasticsearch&#xff5c;kibana 日志分析系统ELKELK概述Elasticsearch安装Elasticsearch部署Elasticsearch集群Elasticsearch插件 熟悉Elasticsearch的API调用_cat API创建 tedu 索引使用 PUT 方式增加数据查询数据修改数据删除数据 KibanaKibana…

锂电池SOC估计 | PyTorch实现基于Basisformer模型的锂电池SOC估计

目录 预测效果基本介绍程序设计参考资料 预测效果 基本介绍 PyTorch实现基于Basisformer模型的锂电池SOC估计 锂电池SOC估计&#xff0c;全新【Basisformer】时间序列预测 1.采用自适应监督自监督对比学习方法学习时序特征&#xff1b; 2.通过双向交叉注意力机制计算历史序列和…

BL、万科、中海地产、碧桂园、华润置地、佳兆业、金地商置、龙湖、绿城、融创、时代中国、旭辉、中国建筑校招笔试题

为了帮助应聘者更好地备战地产公司的招聘考试&#xff0c;我将介绍以下13套校招试题资料&#xff0c;涵盖了24 BL、24万科、24中海地产、碧桂园、华润置地、佳兆业、金地商置、龙湖、绿城、融创、时代中国、旭辉和中国建筑等知名房地产企业&#xff0c;为您提供全方位的备考资源…

提高移动应用的安全性:策略与实践

提高移动应用的安全性&#xff1a;策略与实践 随着移动应用的普及&#xff0c;安全性问题变得日益重要。用户数据保护、应用逻辑安全、以及防止恶意攻击都是开发者必须关注的重点。本文将探讨如何通过一系列策略和实践来提高移动应用的安全性。 1. 数据加密与保护 敏感数据加…

【CMake】(10) 变量操作

追加 追加操作允许你将新元素添加到现有的变量或列表中。 使用 set 进行变量追加 set 命令不仅可以用于定义变量,还可以用于修改变量的值,包括追加新值。下面是 set 命令用于追加操作的示例: cmake_minimum_required(VERSION 3.0) project(TEST)set(VAR "Hello&quo…

2024年环境安全科学、材料工程与制造国际学术会议(ESSMEM2024)

【EI检索】2024年环境安全科学、材料工程与制造国际学术会议&#xff08;ESSMEM2024) 会议简介 我们很高兴邀请您参加将在三亚举行的2024年环境安全科学、材料工程和制造国际学术会议&#xff08;ESSMEM 2024&#xff09;。 ESSMEM2024将汇集世界各国和地区的研究人员&…

BST基本性质,LeetCode 235. 二叉搜索树的最近公共祖先

一、题目 1、题目描述 给定一个二叉搜索树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为&#xff1a;“对于有根树 T 的两个结点 p、q&#xff0c;最近公共祖先表示为一个结点 x&#xff0c;满足 x 是 p、q 的祖先且 x 的深度尽可能大&#xff08…

李宏毅2023机器学习作业1--homework1——数据集操作

一、下载数据 下载训练数据covid.train.csv 测试数据covid.test.csv !wget -O covid_train.csv https://www.dropbox.com/s/lmy1riadzoy0ahw/covid.train.csv?dl0 !wget -O covid_test.csv https://www.dropbox.com/s/zalbw42lu4nmhr2/covid.test.csv?dl0 二、划分训练集和…

【Spring Boot 3】【JPA】@OneToMany 实现一对多单向关联

【Spring Boot 3】【JPA】@OneToMany 实现一对多单向关联 背景介绍开发环境开发步骤及源码工程目录结构总结背景 软件开发是一门实践性科学,对大多数人来说,学习一种新技术不是一开始就去深究其原理,而是先从做出一个可工作的DEMO入手。但在我个人学习和工作经历中,每次学…