海光DCU编译安装Cupy

现在国产GPU比较重视AI,大都对Pytorch和TensorFlow做了移植。但是像Numpy,cupy这些科学计算库也非常重要,数据分析和处理也是一个非常大的需求。

Cupy对AMD的Rocm的支持目前还是实验性的,只支持4.3和5.0两个版本。海光DCU与 Rocm同源,dtk23.10是基于5.2的分支,所以理论上具备可行性。

直接按照官方文档pip安装不行,只能从源代码编译安装

首先要设置相关环境变量

export CUPY_INSTALL_USE_HIP=1
export ROCM_HOME=/opt/dtk-23.10
export HCC_AMDGPU_TARGET=gfx906

另外还要设置

export LIBRARY_PATH=/opt/dtk-23.10/roctracer/lib:$LIBRARY_PATH

之后再pip安装即可,新版本13不行,缺少libamdhip64.so.5,降级到12即可

pip install cupy==12.*

跑了官网测试代码还行

>>> import cupy as cp
>>> x = cp.arange(6, dtype='f').reshape(2, 3)
>>> y = cp.arange(3, dtype='f')
>>> kernel = cp.ElementwiseKernel(
...     'float32 x, float32 y', 'float32 z',
...     '''
...     if (x - 2 > y) {
...       z = x * y;
...     } else {
...       z = x + y;
...     }
...     ''', 'my_kernel')
>>> kernel(x, y)
array([[ 0.,  2.,  4.],[ 0.,  4.,  10.]], dtype=float32)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/17048.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

文心智能体大赛:情深智导

情深智导 概述限制澄清个性化 预览体验 概述 情深向导,致力于为您和您的孩子提供科学、个性化的情感支持与指导。无论您在家庭教育上遇到什么困惑,或是想了解孩子的内心世界,我都会在您身边,与您共同探索,助力亲子关系…

keepalived交叉编译

前言 Keepalived可以实现对服务器的健康检查,当主服务器出现故障时,自动将服务切换到备份服务器上,确保服务的连续性,避免单点故障。它还可以管理一个虚拟 IP 地址,在主备服务器之间进行灵活切换,对外提供…

使用 Python 编程语言进行供应链分析

前言 要分析一家公司的供应链,我们需要供应链不同阶段的数据,如有关采购、制造、运输、库存管理、销售和客户人口统计的数据。我为这项任务找到了一个理想的数据集,其中包括一家时尚和美容初创公司的供应链数据。 1. 相关数据集 让我们导入…

【C++风云录】进化计算框架全览:遗传算法与优化

打开进化计算世界的大门:从多维度了解进化计算框架与库 前言 在复杂的计算领域,进化计算框架和算法库扮演着至关重要的角色。本文将探讨和比较六种不同的进化计算框架和库,包括EO、Pagmo、Shark、ParadisEO、GALib及Open BEAGLE。 欢迎订阅…

打造坦克游戏:类方法的深入解析

新书上架~👇全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我👆,收藏下次不迷路┗|`O′|┛ 嗷~~ 目录 一、引言:坦克游戏与类方法的结合 二、坦克类的属性与方法概述 1. 属性定义与初…

Modbus协议基础

文章目录 Modbus概述Modbus TCP/IP Modbus概述 Modbus是由Modicon(现为施耐德电气公司的一个品牌)在1979年发明的,是全球第一个真正用于工业现场的应用层总线协议。 为更好地普及和推动Modbus在基于以太网上的分布式应用,目前施…

如何学习一个新技能

1. 提出想法 2.找到学习方法,学习路径 3.开始学 参考视频:如何成为超速学习者?快速学会任何新技能!_哔哩哔哩_bilibili

架构每日一学 12:架构师创造价值必备的四项能力

架构活动就是为了一个架构目标而采取的行动。一个架构活动,可能有成百上千的人参与协同,那么在这个工作过程中,架构师要能够明确自己的定位,哪些事情是自己应该做的,哪些事情不该做。 在这个过程中,架构主…

Ubuntu 安装 LibreOffice

1. 删除预安装的LibreOffice Ubuntu 和其他的 Linux 发行版带有预安装的 LibreOffice。这可能不是最新的,这是因为发行版有特定的发行周期。在进行新安装之前,你可以通过以下命令删除 Ubuntu 及其衍生发行版中的的旧版本。 sudo apt remove –purge li…

vs code怎么补全路径,怎么快捷输入文件路径

安装插件: 链接:https://marketplace.visualstudio.com/items?itemNamejakob101.RelativePath 使用 按住 Ctrl Shift H,弹出窗口,输入文件补全,回车就可以了 排除文件 如果你的项目下文件太多,它会…

基础—SQL—图形化界面工具的DataGrip使用(2)

一、回顾与引言 (1) 上次内容,博客讲到了DDL语句的数据库操作、表操作、表字段的操作的相关语法,然而之前都是在MySQL的命令行当中去操作演示的。这种方式可以用,但是使用的话,第一,在我们日常…

【系统架构师】-论文-自动化运维管理在项目中的应用

2024年上半年软考系统架构师-论文2,自动化运维管理 摘要 随着软件系统的复杂性和规模的不断增加,传统的手工运维方式已无法满足高效稳定的运维需求。自动化运维管理作为现代软件架构中的重要组成部分,通过自动化的手段实现系统的部署、监控…

华为交换机、路由器开局(基础配置及远程登录)

一、开局配置目的 新采购的设备,上架安装入网使用。使用仿真工具,通过Console口登录,进行设备管理。需要基础配置,如:管理IP地址、远程管理(管理口、telnet、SSH华为又称Stelnet),包括不限于设备名称、提示…

在jetson nano中安装jetson.inference模块

jetson.inference 是 NVIDIA Jetson 平台的一部分,用于运行深度学习推理。确保你的开发环境是 NVIDIA Jetson 设备,然后按照官方文档进行安装:https://github.com/dusty-nv/jetson-inference jetson-inference 不是通过 pip 安装的常规 Pyth…

代码随想录算法训练营第四十一天| 509. 斐波那契数 、70. 爬楼梯 、746. 使用最小花费爬楼梯

509. 斐波那契数 题目链接:509. 斐波那契数 文档讲解:代码随想录/斐波那契数 视频讲解:视频讲解-斐波那契数 状态:已完成(1遍) 解题过程 看到题目的第一想法 虽然看了卡哥的动态规划五部曲,…

编译原理 期末复习笔记整理(上)

资料借鉴: 【编译原理】期末复习 零基础自学_哔哩哔哩_bilibili 编译原理笔记 第一章 引论 1.编译原理逻辑过程: 词法分析 语法分析 语义分析 中间代码生成 编译代码生成 2.词法分析 任务: 输入源程序,对…

解决 fatal: Not a git repository (or any of the parent directories): .git 问题

解决方法:在命令行 输入 git init 然后回车就好了

人机协同中的可解释性与不可解释性

在人机协同中,实现可解释性与不可解释性(可接受的)的恰当结合是一种最佳途径。这意味着在某些情况下,人工智能系统的决策和输出可能无法完全解释或理解,但仍然是可接受的,因为它们在特定的情境下是有效的和…

全面解析Java.lang.ClassCastException异常

全面解析Java.lang.ClassCastException异常 全面解析Java.lang.ClassCastException异常:解决方案与最佳实践 🚀📚摘要引言1. 什么是Java.lang.ClassCastException?代码示例 2. 报错原因2.1 类型不兼容2.2 泛型类型擦除2.3 接口和实…

02 FreeRTOS 任务

1、创建任务函数 1.1 动态内存的使用 在之前我们如果要创建一个与学生有关的任务,我们会定义: //打印50个学生的信息 char name[50][100]; int age[50]; int sex[50]; //1表示男,0表示女 int score[50]; 如果之后要对其进行修改会非常麻烦&…