文章目录
- 安装nvidia/gpu-operator支持GPU在容器中共享
安装nvidia/gpu-operator支持GPU在容器中共享
安装 nvidia/gpu-operator遇到两个问题:
- 由于我们都懂的某个原因,导致某些镜像一直现在不成功。
解决办法,准备一个🪜;
或者,修改镜像地址,换成能访问的。 - 安装在宿主机上的
nvidia-container-toolkit
配置给 containerd 使用; 我们的k8s使用的rke2;rke2 托管了containerd 的配置文件,直接修改重启后会被重置回去。
最后,我们采用https://thenewstack.io/install-a-nvidia-gpu-operator-on-rke2-kubernetes-cluster/
这篇文档中的步骤成功将 nvidia/gpu-operator 安装上了。
当时安装的详细步骤没有记录,重现起来太累了,也没有多少人阅读;说来算是虎头蛇尾,惭愧呀……