文章目录
- 概要
- autoDL系统盘爆满
- autoDL python3.8切换python3.10
- dreambooth训练大模型完成后报错
概要
主要是通过autoDL服务器部署stable diffusion,通过dreambooth训练大模型。
问题:
- autoDL系统盘爆满
- autoDL python3.8切换python3.10
- dreambooth训练大模型完成后报错
autoDL系统盘爆满
- 服务器官网给了解决办法,系统盘不足的解决地址。
- 但是你要是想通过dreambooth训练模型,就不能按照这个文档操作。
- 在 .cacah/文件中有个缓存
huggingface
文件,删除后dreambooth找不到huggingface资源就报错。 - 所以大家在清除.cacah/路径下的文件时,一定注意不要删除这个huggingface缓存资源。
autoDL python3.8切换python3.10
更换python环境,主要是在sd服务中安装Kohya_ss,这个图片预处理打完tag后,直接进行训练lora。
执行如下程序,在my-env虚拟环境中操作,就可以运行Kohya_ss。
# 构建一个虚拟环境名为:my-env,Python版本为3.7
conda create -n my-env python=3.10.12 # 更新bashrc中的环境变量
conda init bash && source /root/.bashrc
# 切换到创建的虚拟环境:my-env
conda activate my-env# 验证
python
其实autodl中有lora训练的服务器,这个训练页面纯txt文件,对新手不友好,而且这个里面没有打标签的工具,还需要在其他sd服务通过图片预处理打好标签后放到这个服务其中,进行训练。新建Kohya_ss如下图:
dreambooth训练大模型完成后报错
报错: Exception training model: ''AttnProcessor2_0' object has no attribute 'state_dict''. 且没有生成大模型
将这个选项勾上,这个选项只要是在运行中报错模型,这个在结束时报错,也不会影响模型保存。
这个路径下就会出现训练的大模型 autodl-tmp/stable-diffusion-webui/models/Stable-diffusion