问题背景
今早打开服务器一看发现昨天挂上去的数据预处理脚本中断了,报错如下:
python3: can't open file 'preprocess_data.py': [Errno 107] Transport endpoint is not connected
之前从来没有遇到过这种问题,于是顺手执行了 cd ..
,也出现了同样的报错:
-bash: cd: ..: Transport endpoint is not connected
后来退出了 tmux
,尝试从 /mnt
里重新进入挂载点,发现根本进不去,删也删不掉。
解决方案
猜测是共享存储的挂载出现了问题,首先尝试卸载挂载点
umount -l /path/to/mountpoint
删除挂载点文件夹
rm -rf /path/to/mountpoint
重新挂载(因为是使用的ceph-fuse挂载的,所以和正常挂载操作可能会有所区别)
cat << EOF >ceph.client.group_b.keyring
[client.group_b]key = <YOUR_KEY_HERE>
EOFmkdir /path/to/mountpoint
ceph-fuse -m <monitor-ip1>:<port>,<monitor-ip2>:<port>,<monitor-ip3>:<port> -r /group_b/ /path/to/mountpoint -n client.group_b --keyring=ceph.client.group_b.keyring