Nvidia docker 验证HSOpticalFlow

前情提要:

docker是dotCloud 公司为了数据库研发的,所以仅支持CPU和数据交换的部分,nvidia公司觉得这是个好东西,自己派人研发了GPU相关的部分,取名为NVIDIA Container Toolkit,我们可以理解为docker+GPU插件,以后深度学习的环境可以用这个,就不用改中间件版本了。

正文

这个服务器上已经有docker了,但是因为没有NVIDIA Container Toolkit,所以运行GPU的images报错,装上之后正常运行了
报错如下:

docker run --gpus all -it --rm nvcr.io/nvidia/pytorch:24.04-py3
docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].

安装代码:

distribution="ubuntu20.04" 这里改成你自己的版本
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit

装完了验证的话,可以输入:

dpkg -l | grep nvidia-container-toolkit

显示:

ii  nvidia-container-toolkit                    1.13.5-1                            amd64        NVIDIA Container toolkit
ii  nvidia-container-toolkit-base               1.13.5-1                            amd64        NVIDIA Container Toolkit Base

然后配置/etc/docker/daemon.json文件,让docker启动时自动调用nvidia驱动

{"runtimes": {"nvidia": {"path": "nvidia-container-runtime","runtimeArgs": []}},"default-runtime": "nvidia"
}

重启docker

sudo systemctl restart docker

验证docker是否成功调用GPU

yhp1szh@SZH-C-006RW:/$ docker run --gpus all -it --rm nvcr.io/nvidia/pytorch:24.04-py3=============
== PyTorch ==
=============NVIDIA Release 24.04 (build 88113656)
PyTorch Version 2.3.0a0+6ddf5cf
Container image Copyright (c) 2024, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
Copyright (c) 2014-2024 Facebook Inc.
Copyright (c) 2011-2014 Idiap Research Institute (Ronan Collobert)
Copyright (c) 2012-2014 Deepmind Technologies    (Koray Kavukcuoglu)
Copyright (c) 2011-2012 NEC Laboratories America (Koray Kavukcuoglu)
Copyright (c) 2011-2013 NYU                      (Clement Farabet)
Copyright (c) 2006-2010 NEC Laboratories America (Ronan Collobert, Leon Bottou, Iain Melvin, Jason Weston)
Copyright (c) 2006      Idiap Research Institute (Samy Bengio)
Copyright (c) 2001-2004 Idiap Research Institute (Ronan Collobert, Samy Bengio, Johnny Mariethoz)
Copyright (c) 2015      Google Inc.
Copyright (c) 2015      Yangqing Jia
Copyright (c) 2013-2016 The Caffe contributors
All rights reserved.Various files include modifications (c) NVIDIA CORPORATION & AFFILIATES.  All rights reserved.This container image and its contents are governed by the NVIDIA Deep Learning Container License.
By pulling and using the container, you accept the terms and conditions of this license:
https://developer.nvidia.com/ngc/nvidia-deep-learning-container-licenseNOTE: The SHMEM allocation limit is set to the default of 64MB.  This may beinsufficient for PyTorch.  NVIDIA recommends the use of the following flags:docker run --gpus all --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 ...root@e09a413296bb:/workspace# nvidia-smi
Thu May  9 05:29:47 2024       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.54.14              Driver Version: 550.54.14      CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 3090        Off |   00000000:17:00.0 Off |                  N/A |
| 75%   62C    P2            203W /  350W |    8385MiB /  24576MiB |    100%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
|   1  NVIDIA GeForce RTX 3090        Off |   00000000:98:00.0 Off |                  N/A |
| 43%   41C    P8             18W /  350W |      10MiB /  24576MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------++-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
+-----------------------------------------------------------------------------------------+
root@e09a413296bb:/workspace# nvcc -C
nvcc fatal   : Unknown option '-C'
root@e09a413296bb:/workspace# nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2024 NVIDIA Corporation
Built on Thu_Mar_28_02:18:24_PDT_2024
Cuda compilation tools, release 12.4, V12.4.131
Build cuda_12.4.r12.4/compiler.34097967_0
root@e09a413296bb:/workspace# python
Python 3.10.12 (main, Nov 20 2023, 15:14:05) [GCC 11.4.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> import torchvision
>>> torch.__version__
'2.3.0a0+6ddf5cf85e.nv24.04'
>>> torch.cuda.get_device_name(0)
'NVIDIA GeForce RTX 3090'
>>> torch.backends.cudnn.version()
90100
>>> torchvision.__version__
'0.18.0a0'

然后把代码弄下来测试
因为代理问题,直接从github下载代码太难了,选择手动上传
先把代码传到服务器这个文件夹里
/mnt/workspace/xiebell/pytorch2404/
容器每次关闭,如果用 --rm,是自动删除的,这里我们不要删除
我的代码存进去后启动容器:

docker start 286f0ced9277docker attach 286f0ced9277

复制服务器文件到容器里:
另开一个terminal

docker cp /mnt/workspace/xiebell/pytorch2404/cuda-samples-master.zip 286f0ced9277:/workspace/xiebell/cuda.zip

显示

Successfully copied 146.6MB to 286f0ced9277:/workspace/xiebell/cuda.zip

此时打开容器查看就有了
解压
至此,文件在容器里已经准备好了,

root@286f0ced9277:/workspace/xiebell/cuda-samples-master# ls
CHANGELOG.md  LICENSE   README.md  Samples_VS2017.sln  Samples_VS2022.sln
Common        Makefile  Samples    Samples_VS2019.sln  bin

下一步准备编译

编译:

$ cd <sample_dir>
$ make

执行文件

./HSOpticalFlow

结果

root@286f0ced9277:/workspace/xiebell/cuda-samples-master/Samples/5_Domain_Specific/HSOpticalFlow# ./HSOpticalFlow 
HSOpticalFlow Starting...GPU Device 0: "Ampere" with compute capability 8.6Loading "frame10.ppm" ...
Loading "frame11.ppm" ...
Computing optical flow on CPU...
Computing optical flow on GPU...
L1 error : 0.044308

只能看懂计算误差,看不懂别的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/9381.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

队列和二叉树

本文主要探讨队列和二叉树的相关知识。 队列 队列结构:队头指针指向队头元素,队尾指针指向队尾元素(链表形式或数组形式) 队列特特点:先进先出,对头插入&#xff0c;队尾出队 双端队列:对头队尾都可插入和出队 二叉树 二叉树:包含根节点和子节点,一个三角组内…

设计模式——解释器模式(Interpreter)

解释器模式&#xff08;Interpreter Pattern&#xff09;是一种行为型设计模式&#xff0c;它给定一个语言&#xff0c;定义它的文法的一种表示&#xff0c;并定义一个解释器&#xff0c;该解释器使用该表示来解释语言中的句子。这种模式主要用来描述如何使用面向对象语言构成一…

VRRP(Virtual Router Redundancy Protocol)虚拟路由器冗余协议

VRRP&#xff08;Virtual Router Redundancy Protocol&#xff09;即虚拟路由器冗余协议&#xff0c;是一种网络容错协议。VRRP通过在多个路由器间建立虚拟的路由身份&#xff0c;提供了一种简单高效的机制来保障网络出口点的高可用性&#xff0c;从而防止因单一设备故障导致的…

CSS基础(CSS导入方式、选择器、属性)

层叠样式表&#xff08;Cascading Style Sheets&#xff0c;缩写为 CSS&#xff09;是一种样式表语言&#xff0c;用来描述 HTML 或 XML&#xff08;包括如 SVG、MathML 或 XHTML 之类的 XML 分支语言&#xff09;文档的呈现方式。CSS 描述了在屏幕、纸质、音频等其他媒体上的元…

《Decoupled Optimisation for Long-Tailed Visual Recognition》阅读笔记

论文标题 《Decoupled Optimisation for Long-Tailed Visual Recognition》 长尾视觉识别的解耦优化 作者 Cong Cong、Shiyu Xuan、Sidong Liu、Shiliang Zhang、Maurice Pagnucco 和 Yang Song、 来自新南威尔士大学计算机科学与工程学院、北京大学计算机学院多媒体信息处…

jenkins+gitlab+sonar自由风格项目配置

新建项目&基本配置 gitlab侧配置 sonar.projectKeytest_sonar sonar.projectNametest_sonar sonar.projectVersion1.0 sonar.sources. sonar.exclusionssrc/layout/** sonar.sourceEncodingUTF-8 sonar.nodejs.executable/app/nodejs/node-v16.20.2-linux-x64/bin/node配置…

如何在Flask中优雅的使用装饰器刷新令牌

随着现代应用对安全性和用户体验的不断追求&#xff0c;令牌验证和刷新机制已成为每个开发者必须掌握的技能。在这篇引人入胜的技术文章中&#xff0c;我们将深入探讨如何使用Python装饰器优雅地处理访问令牌的刷新&#xff0c;让您的代码不仅高效而且易于维护。 一、引言 在…

pgsql查看指定模式的存储过程

pgsql查看指定模式的存储过程 在 PostgreSQL 中&#xff0c;如果你想要查看指定模式的存储过程&#xff08;也称为函数&#xff09;&#xff0c;你可以使用 \df 或 \df 命令在 psql 命令行工具中&#xff0c;或者使用 SQL 查询来从 pg_catalog 系统模式中查询。 \df命令行查询…

Linux 中 POSIX 互斥信号量(互斥锁)的使用

目录 一、互斥锁的介绍二、使用方法三、测试代码 一、互斥锁的介绍 在Linux系统中&#xff0c;特别是在ARM架构的嵌入式系统中&#xff0c;互斥量&#xff08;Mutex&#xff09;用于保护共享资源不被多个线程或任务同时访问&#xff0c;从而防止数据竞争和不一致性。 POSIX 互斥…

学习java第六十五天

Spring中Bean的生命周期可以细分为以下几个阶段&#xff0c;并在每个阶段提供了相应的扩展点&#xff1a; 实例化&#xff08;Instantiation&#xff09;: Spring IoC容器根据BeanDefinition创建Bean实例。 扩展点&#xff1a;在实际实例化之前&#xff0c;可以通过实现org.spr…

旅游组团奖励标准,申报条件!利川市旅游组团奖励办法

利川市旅游组团奖励有哪些&#xff1f;关于利川市旅游组团奖励标准&#xff0c;申报条件整理如下&#xff1a; 第一条根据《湖北省人民政府办公厅印发关于更好服务市场主体推动经济稳健发展若干政策措施的通知》&#xff08;鄂政办发〔2022〕54号&#xff09;、《恩施州人民政府…

一个完整性能测试流程(非常详细)零基础入门到精通,收藏这一篇就够了

一、性能测试流程规范化的意义 规范化的性能测试流程能帮助测试发现潜在的性能问题和瓶颈&#xff0c;也能确保性能测试的可重复性和可比性。 同时可以帮助确定系统的容量&#xff0c;降低风险及维护成本&#xff0c;提高用户体验和满意度。 二、性能测试流程 一&#xff09…

linux高性能服务器--Ngix内存池简单实现

文章目录 内存模型&#xff1a;流程图内存对齐code 内存模型&#xff1a; 流程图 内存对齐 对齐计算 要分配一个以指定大小对齐的内存&#xff0c;可以使用如下公式&#xff1a; 假设要分配大小为n&#xff0c;对齐方式为x&#xff0c;那么 size(n(x-1)) & (~(x-1))。 举个…

快速了解Vuex

Vuex Vuex使用Vuex Vuex &#x1f4cc;vuex 是一个专为 Vue.js 应用程序开发的状态管理库 &#x1f4cc;vuex 可以在多个组件之间共享数据&#xff0c;并且共享的数据是响应式的&#xff0c;即数据的变更能及时渲染到模板 &#x1f4cc;vuex 采用集中式存储管理所有组件的状态…

C++ 70. 爬楼梯

文章目录 一、题目描述二、参考代码 一、题目描述 示例 1&#xff1a; 输入&#xff1a;n 2 输出&#xff1a;2 解释&#xff1a;有两种方法可以爬到楼顶。 1 阶 1 阶2 阶 示例 2&#xff1a; 输入&#xff1a;n 3 输出&#xff1a;3 解释&#xff1a;有三种方法可以爬到…

发表博客之:gemm/threadblock/threadblock_swizzle.h 文件夹讲解,cutlass深入讲解

文章目录 [发表博客之&#xff1a;gemm/threadblock/threadblock_swizzle.h 文件夹讲解&#xff0c;cutlass深入讲解](https://cyj666.blog.csdn.net/article/details/138514145)先来看一下最简单的struct GemmIdentityThreadblockSwizzle结构体 发表博客之&#xff1a;gemm/th…

InfiniGate自研网关实现四

13.服务发现组件搭建和注册网关连接 以封装 api-gateway-core 为目的&#xff0c;搭建 SpringBoot Starter 组件&#xff0c;用于服务注册发现的相关内容处理。 这里最大的目的在于搭建起用于封装网关算力服务的 api-gateway-core 系统&#xff0c;提供网关服务注册发现能力。…

【Python技术】使用akshare、pandas高效复盘每日涨停板行业分析

作为一个程序员宝爸&#xff0c;每天的时间很宝贵&#xff0c;工作之余除了辅导孩子作业&#xff0c;就是补充睡眠。 怎么快速高效的进行当天A股涨停板的复盘&#xff0c;便于第二天的跟踪。这里简单写个示例&#xff0c; 获取当天连涨数排序&#xff0c;以及所属行业排序。 …

ICode国际青少年编程竞赛- Python-2级训练场-迷宫

ICode国际青少年编程竞赛- Python-2级训练场-迷宫 1、 Dev.step(3) Dev.turnLeft() for i in range(2):Dev.step(4)Dev.turnRight() for i in range(2):Dev.step(2)Dev.turnLeft() Dev.step(3) Dev.step(-9)2、 Dev.step(3) Dev.turnRight() Dev.step(2) Dev.turnLeft() for i …

TCP及IP协议

TCP协议的传输是可靠的&#xff0c;而UDP协议的传输“尽力而为” TCP传输可靠性———确认&#xff0c;重传&#xff0c;排序&#xff0c;流控。 流控&#xff1a;滑动窗口机制 TTL--- 数据包每经过一个路由器的转发&#xff0c;他的TTL值将减1&#xff0c;当一个数据包中的T…