如何知道docker谁占用的显卡的显存?

文章目录

  • python环境安装nvidia-htop
  • 查看pid
  • 加一个追踪
  • 总结一下【找到容器创建时间】
      • 使用说明
      • 示例
  • 再总结一下【用PID找到容器创建时间,从而找到谁创建的】
      • 使用说明
      • 示例

python环境安装nvidia-htop

nvidia-htop是一个看详细的工具。

pip3 install nvidia-htop

查看pid

指令是:

nvidia-smi | nvidia-htop.py -l

比如0卡有进程PID是3311673,是root占用。凡是USER里不是普通用户名的,都是docker run起来的容器在使用显存。如何查看3311673是谁在占用?
在这里插入图片描述

我们需要找到进程的 cgroup 文件,然后从 cgroup 文件中提取容器 ID。

找到进程的 cgroup 文件:

cat /proc/3311673/cgroup

在这里插入图片描述

容器id是923dc8979571a的这个容器,启动了进程3311673,占用了显存。容器的名字是daonan_sdxl。

在这里插入图片描述

这一步之后只有审计追溯了,或者可以从inspect里找一些信息确认一下。

docker inspect daonan_sdxl

在这里插入图片描述

查了一下:https://cloud.tencent.com/developer/ask/sof/115145807,使用docker 就相当于是匿名用户,docker本身不会记忆谁执行了它。

加一个追踪

在Docker中,直接通过Docker命令来追踪启动容器的具体用户是不太可能的,因为Docker并不会默认记录启动容器的用户信息。不过,可以通过以下一些方法来间接地追踪和记录相关信息:

创建文件:

touch /var/log/docker-commands.log
chmod 777 /var/log/docker-commands.log

进入这里:

cd /usr/bin/
mv docker docker-original

创建一个脚本 docker

vim docker

#!/bin/bash# 记录docker run命令
if [[ "$1" == "run" ]]; thenecho "$(date) - $(whoami) - $@" >> /var/log/docker-commands.log
fi# 执行docker命令
/usr/bin/docker-original "$@"

加权限:

sudo chmod +x /usr/bin/docker

ok!

总结一下【找到容器创建时间】

创建这个脚本:

#!/bin/bash# 检查是否提供了PID参数
if [ -z "$1" ]; thenecho "Usage: $0 <PID>"exit 1
fiPID=$1# 获取进程的cgroup文件内容
CGROUP_FILE="/proc/$PID/cgroup"if [ ! -f "$CGROUP_FILE" ]; thenecho "PID $PID does not exist or /proc/$PID/cgroup file not found."exit 1
fi# 提取容器ID
CONTAINER_ID=$(cat $CGROUP_FILE | grep 'docker' | sed 's/.*\///' | grep -o -E '[0-9a-f]{64}' | tail -n 1)if [ -z "$CONTAINER_ID" ]; thenecho "No Docker container found for PID $PID."exit 1
fi# 获取容器名称
CONTAINER_NAME=$(docker inspect --format '{{.Name}}' $CONTAINER_ID | sed 's/^\/\(.*\)/\1/')if [ -z "$CONTAINER_NAME" ]; thenecho "Failed to retrieve container name for container ID $CONTAINER_ID."exit 1
fi# 获取容器创建时间
CONTAINER_CREATED=$(docker inspect --format '{{.Created}}' $CONTAINER_ID)if [ -z "$CONTAINER_CREATED" ]; thenecho "Failed to retrieve creation time for container ID $CONTAINER_ID."exit 1
fi# 输出结果
echo "Container ID: $CONTAINER_ID"
echo "Container Name: $CONTAINER_NAME"
echo "Container Created: $CONTAINER_CREATED"exit 0

使用说明

  1. 将上述脚本保存为 find_container_by_pid.sh
  2. 给脚本添加执行权限:
    chmod +x find_container_by_pid.sh
    
  3. 运行脚本并传入一个PID:
    ./find_container_by_pid.sh <PID>
    

示例

./find_container_by_pid.sh 3311673

该脚本将会输出指定PID对应的容器ID、容器名称和容器创建时间。

在这里插入图片描述

再总结一下【用PID找到容器创建时间,从而找到谁创建的】

可以通过编写一个新的Shell脚本来实现这个功能。这个脚本将会基于容器的创建时间,从日志文件 /var/log/docker-commands.log 中查找对应的记录。以下是这个新脚本的实现:

#!/bin/bash# 检查是否提供了PID参数
if [ -z "$1" ]; thenecho "Usage: $0 <PID>"exit 1
fiPID=$1# 调用之前的脚本来获取容器ID、名称和创建时间
container_info=$(./find_container_by_pid.sh $PID)
if [ $? -ne 0 ]; thenecho "Failed to get container info for PID $PID."exit 1
fi# 提取容器创建时间和容器ID
CONTAINER_CREATED=$(echo "$container_info" | grep "Container Created:" | awk '{print $3}')
CONTAINER_ID=$(echo "$container_info" | grep "Container ID:" | awk '{print $3}')echo $CONTAINER_ID# 将创建时间转换为前后1秒的时间范围
start_time=$(date -d "$(echo $CONTAINER_CREATED | sed 's/Z//') -1 second" +"%Y-%m-%dT%H:%M:%S")
end_time=$(date -d "$(echo $CONTAINER_CREATED | sed 's/Z//') +1 second" +"%Y-%m-%dT%H:%M:%S")# 从日志文件中查找对应时间范围的记录
log_file="/var/log/docker-commands.log"
if [ ! -f "$log_file" ]; thenecho "Log file $log_file not found."exit 1
fiecho "Searching for logs between $start_time and $end_time"
log_entries=$(grep -E "$start_time|$end_time" $log_file)# 打印结果
if [ -z "$log_entries" ]; thenecho "No log entries found for the specified time range."
elseecho "Log entries found:"echo "$log_entries"echo ""echo "Container Creator and ID:"echo "$log_entries" | while read -r line ; docreator=$(echo $line | awk '{print $4}')echo "Creator: $creator, Container ID: $CONTAINER_ID"done
fiexit 0

使用说明

  1. 确保之前的脚本 find_container_by_pid.sh 是可执行的,并且路径正确。
  2. 将上述新脚本保存为 find_container_creator.sh
  3. 给新脚本添加执行权限:
    chmod +x find_container_creator.sh
    
  4. 运行新脚本并传入一个PID:
    ./find_container_creator.sh <PID>
    

示例

./find_container_creator.sh 3311673

该脚本将会基于容器的创建时间,从日志文件 /var/log/docker-commands.log 中查找对应时间范围的记录,并打印出来。希望这个新脚本能满足你的需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/37073.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JAVA编程题期末题库【中】

8.计算邮资 程序代码: public static void main(String[] args) {// 计算邮资//if多分支语句//创建对象java.util.Scanner inputnew java.util.Scanner(System.in); //提示输入用户&#xff0c;输入邮件的重量System.out.println("邮件的重量&#xff1a;");int wei…

学习笔记——动态路由——OSPF(OSPF协议的工作原理)

八、OSPF协议的工作原理 1、原理概要 (1)相邻路由器之间周期性发送HELLO报文&#xff0c;以便建立和维护邻居关系 (2)建立邻居关系后&#xff0c;给邻居路由器发送数据库描述报文(DBD)&#xff0c;也就是将自己链路状态数据库中的所有链路状态项目的摘要信息发送给邻居路由器…

【Python自动化测试】如何才能让用例自动运行完之后,生成一张直观可看易懂的测试报告呢?

小编使用的是unittest的一个扩展HTMLTestRunner 环境准备 使用之前&#xff0c;我们需要下载HTMLTestRunner.py文件 点击HTMLTestRunner后进入的是一个写满代码的网页&#xff0c;小编推荐操作&#xff1a;右键 --> 另存为&#xff0c;文件名称千万不要改 python3使用上述…

如何断点调试opencv源码

分几个步骤&#xff1a; 1、下载opencv-4.10.0-windows.exe https://opencv.org/releases/ 2、想要调试opencv的源码&#xff0c;只需要将这两个文件拷贝到我们自己项目的可执行文件的同级目录内即可。 完成拷贝后&#xff0c;直接在vs工程中打断点F11进行单步调试&#xff…

【漏洞复现】FastAdmin——任意文件读取漏洞

声明&#xff1a;本文档或演示材料仅供教育和教学目的使用&#xff0c;任何个人或组织使用本文档中的信息进行非法活动&#xff0c;均与本文档的作者或发布者无关。 文章目录 漏洞描述漏洞复现测试工具 漏洞描述 FastAdmin是一个免费开源的后台管理框架&#xff0c;其lang存在…

计算机网络 —— 网络字节序

网络字节序 1、网络字节序 (Network Byte Order)和本机转换 1、大端、小端字节序 “大端” 和” 小端” 表示多字节值的哪一端存储在该值的起始地址处&#xff1b;小端存储在起始地址处&#xff0c;即是小端字节序&#xff1b;大端存储在起始地址处&#xff0c;即是大端字节…

以创新赋能引领鸿蒙应用开发,凡泰极客亮相华为HDC2024

6月21日至23日&#xff0c;华为开发者大会2024在松山湖举行。大会现场&#xff0c;华为发布了HarmonyOS、盘古大模型等方面最新进展。国内外众多企业齐聚一堂&#xff0c;共迎新商机、共创新技术、共享新体验。 凡泰极客作为鸿蒙生态的重要战略合作伙伴&#xff0c;同时也是鸿…

【vue3|第14期】深入Vue3自定义Hooks:掌握组件逻辑复用的核心

日期&#xff1a;2024年6月26日 作者&#xff1a;Commas 签名&#xff1a;(ง •_•)ง 积跬步以致千里,积小流以成江海…… 注释&#xff1a;如果您觉得有所帮助&#xff0c;帮忙点个赞&#xff0c;也可以关注我&#xff0c;我们一起成长&#xff1b;如果有不对的地方&#xf…

动力环境监控系统内部绝密报价!动环监控系统全套价格一览

作为一个综合性的监控系统&#xff0c;动力环境监控系统包含动力系统、环境系统、安防系统等&#xff0c;是整个机房的控制中枢&#xff0c;无论哪里出现问题都可以实时监测到&#xff0c;并在第一时间通知管理人员。当然&#xff0c;根据机房大小和监测需求不同&#xff0c;动…

Windows系统开启python虚拟环境

.\env4socre\Scripts\activate : 无法加载文件 E:\SocreMan\env4socre\Scripts\Activate.ps1&#xff0c;因为在此系统上禁止运行脚本。 环境&#xff1a;windows 11、vscode 1、用管理员权限打开powershell 输入set-executionpolicy remotesigned&#xff0c;选择Y 2、返回v…

稀疏迭代最近点算法(Sparse ICP)

2013年&#xff0c;2013年Sofien Bouaziz等提出了一种新的ICP改进算法&#xff0c;稀疏迭代最近点(Sparse Iterative Closest Point, Sparse ICP)算法。更多扩展资料可参看随书附赠资源中的说明文档。 Sparse ICP算法的设计的灵感、应用范围、优缺点和泛化能力 两个几何数据集…

NAS—网络附加存储

关键词&#xff1a;私有化存储、Nas、云盘、群晖、Tailscale、 前言 身处于互联网时代的我们&#xff0c;几乎每时每刻都在与计算机打交道&#xff0c;而软件则作为我们和计算机之间沟通的桥梁&#xff0c;因此可以认为软件的作用是&#xff1a;将计算机能力进行包装&#xf…

瓦罗兰特新赛季更新资讯 瓦罗兰特新赛季免费加速器

瓦罗兰特新赛季来喽&#xff0c;这是一款由拳头开发的免费第一人称射击游戏&#xff0c;游戏凭借其独特的玩法和丰富的英雄选择吸引了大量玩家。 我们可以在游戏中选择自己喜欢的角色出场与敌人进行对战&#xff0c;而且每一个角色都有自己独特的道具以及技能&#xff0c;使用好…

SwiftUI 中的内容边距

文章目录 前言创建示例适配 iPad使用 contentMargins可运行 Demo总结前言 SwiftUI 引入了一组视图修饰符,使我们能够有效地管理视图中的安全区域。在许多情况下,安全区域是你希望放置内容的地方。今天,我们将了解 SwiftUI 引入的新内容边距概念以及它与安全区域的区别。 创…

【Proteus仿真】多变循环彩灯

【Proteus仿真】多变循环彩灯 ‍ 01功能描述 10种灯光效果可通过按键进行切换/通过按键切换灯光效果&#xff0c;通过数码管显示当前灯光模式&#xff0c;并通过按键调节当前灯光速度快慢。 02原理图 ​​ ‍ 03资料内容 源码仿真 04资料获取链接 https://docs.qq.co…

【unity笔记】五、UI面板TextMeshPro 添加中文字体

Unity 中 TextMeshPro不支持中文字体&#xff0c;下面为解决方法&#xff1a; 准备字体文件&#xff0c;从Windows系统文件的Fonts文件夹里拖一个.ttf文件&#xff08;C盘 > Windows > Fonts &#xff09; 准备字库文件,新建一个文本文件&#xff0c;命名为“字库”&…

确认偏差:金融市场交易中的隐形障碍

确认偏差&#xff0c;作为一种深刻影响交易员决策与表现的心理现象&#xff0c;其核心在于个体倾向于寻求与既有信念相符的信息&#xff0c;而自动过滤或轻视与之相悖的资讯。这种认知偏见严重扭曲了交易者的决策过程&#xff0c;导致他们过分依赖符合既有观念的数据&#xff0…

pdf合并,这三种方法学会了吗?

在信息爆炸的时代&#xff0c;PDF文档凭借其跨平台、不易修改的特性&#xff0c;成为了我们工作和学习中不可或缺的一部分。然而&#xff0c;当面对多个PDF文件需要合并成一个完整的文档时&#xff0c;许多人可能会感到头疼。今天&#xff0c;就让我们一起来探讨三种高效的PDF合…

Rust Eq 和 PartialEq

Eq 和 PartialEq 在 Rust 中&#xff0c;想要重载操作符&#xff0c;你就需要实现对应的特征。 例如 <、<、> 和 > 需要实现 PartialOrd 特征: use std::fmt::Display;struct Pair<T> {x: T,y: T, }impl<T> Pair<T> {fn new(x: T, y: T) ->…

C#——里氏转换详情

里氏转换 里氏转换就是派生类的对象赋值给父类对象&#xff0c;反之则不行 实例 : 先创键一个类然后继承 调用