问题
加载模型权重文件时获取model_state_dict键失败
解决
单步调试发现保存模型权重时正确保存了该键值对,再次调试时发现莫名奇妙又没错了
首先确认保存模型时的状态字典键名:确保在保存模型权重时,正确地使用了 model.state_dict() 方法,并且以 ‘model_state_dict’ 作为键将其放入字典中保存
可以单步运行看是否保存到了字典中
在训练过程中,如果不断保存和加载模型权重(.pt 文件),并且在保存时没有问题,但在加载时偶尔出现 KeyError: 'model_state_dict'
错误,这通常是因为:
1.加载的 .pt 文件不完整或者不是通过正确的方式(即包含 ‘model_state_dict’ 的字典)保存的。
2.在多线程或多进程环境中,可能存在文件操作的竞态条件(race condition),即在模型权重文件写入完成之前就开始加载文件,导致加载到的不是一个完整的、有效的模型状态字典。
可以通过删除pt文件重新生成来解决