问题描述
在训练模型的过程中遇到了apex库的报错IndexError: tuple index out of range
导致无法训练。在github查询后找到了解决方法
问题解决
需要修改/apex-master/apex/amp/utils.py
这个文件的代码
从93行开始修改
if x in cache:cached_x = cache[x]next_functions_available = Falseif x.requires_grad and cached_x.requires_grad:if len(cached_x.grad_fn.next_functions) > 1:next_functions_available = True# Make sure x is actually cached_x's autograd parent.if next_functions_available and cached_x.grad_fn.next_functions[1][0].variable is not x:
在修改下边120行左右
elif x.requires_grad and cached_x.requires_grad and not next_functions_available:del cache[x]
最后重新运行一遍apex的安装程序,再次运行训练就不会报错了
点击访问博客查看更多内容 |
---|