PyTorch Autograd内部实现

PyTorch Autograd内部实现

web/2025/7/4 11:59:42/文章来源:https://blog.csdn.net/smartcat2010/article/details/140455716

原文：

克補爆炸篇 25s (youtube.com)

必应视频 (bing.com)https://www.bing.com/videos/riverview/relatedvideo?&q=PyTorch+autograd&qpvt=PyTorch+autograd&mid=1B8AD76943EFADD541E01B8AD76943EFADD541E0&&FORM=VRDGAR

前面只要有一个node的requires_grad为True，则后面所有node都要为True:

forward阶段，ctx里存放其backward操作需要的值，也就是forward时的部分input或output值；

requires_grad为False的(Tensor b)，不会计算其梯度；

requires_grad为True，且is_leaf为Tree的，会将梯度累积到其grad成员上；

优化：如果is_leaf=False，则说明不需要该Tensor的grad，所以，grad_fn直接将output梯度传递给下一个grad_fn了，绕开对该Tensor的grad的更新；（节省一步梯度加和操作的时间，也节省一个grad数据存储空间）

用_version号来防止backward时用到的activation在之前发生改动；如果_version号跟本次backward源头的_version号不同了，则报错；

我：Pipeline并行，如果直接做，就会有这种报错出现；

如果是Add操作这种，压根不需要某些activation的值，所以这种值发生改动，不影响backward传递参数，因此就不会报错

每个运算，是一个独立的operator，对应backward也是独立的：

Tensor.detach()，用在什么情况：想保留结果值，但又想把原始计算图垃圾回收释放掉；新Tensor和老Tensor共享数据内存(data)，但不在hold指向计算图的reference了(grad_fn=None)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/web/47096.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

北京交通大学《深度学习》专业课，实验3卷积、空洞卷积、残差神经网络实验

北京交通大学《深度学习》专业课，实验3卷积、空洞卷积、残差神经网络实验

一、实验要求 1. 二维卷积实验（平台课与专业课要求相同） ⚫ 手写二维卷积的实现，并在至少一个数据集上进行实验，从训练时间、预测精度、Loss变化等角度分析实验结果（最好使用图表展示） ⚫ 使用torch.nn…

阅读更多...

Matlab基础语法篇（下）

Matlab基础语法篇（下）

Matlab基础语法（下） 一、逻辑基础（一）逻辑运算符（二）all、any、find函数（三）练习二、结构基础（一）条件结构（1）if-elseif-else-end&am…

阅读更多...

Android构建任务assemble、bundle、compile、package、install

Android构建任务assemble、bundle、compile、package、install

1. assemble 开头的任务： assembleDebug：构建 debug 版本的 APK 文件。assembleRelease：构建 release 版本的 APK 文件。assembleAndroidTest：构建测试 APK 文件，用于测试应用程序。assembleAndroidTestDebug&#xf…

阅读更多...

十、操作符详解

十、操作符详解

目录 1、操作符分类 2、二进制转换 2.1二进制转十进制 2.1.1、十进制转二进制 2.2、二进制转八进制和十六进制 2.2.1、二进制转八进制 2.2.2、二进制转十六进制 3、原码、反码、补码 4、移位操作符（移动的是二进制位） 4.1、左移操作符 4.2、右…

阅读更多...

VMware虚拟机下安装Ubuntu（详细教程，最小系统的安装，含VMware Tools）

VMware虚拟机下安装Ubuntu（详细教程，最小系统的安装，含VMware Tools）

1.VM的下载安装 VMware的下载安装教程_vm16 pro下载-CSDN博客 2. Ubuntu 下载在官网或者镜像站下载所需版本的.ios镜像，这个镜像在接下来的步骤中会用到： Ubuntu 22.04.4 LTS 下载和清华大学开源软件镜像站 - Ubuntu 22.04.4 下载 3. 创建虚拟机 […

阅读更多...

【C语言】深入解析希尔排序

【C语言】深入解析希尔排序

文章目录什么是希尔排序？希尔排序的基本实现代码解释希尔排序的优化希尔排序的性能分析希尔排序的实际应用结论在C语言编程中，希尔排序是一种高效的排序算法，是插入排序的一种更高效的改进版本。它通过比较相距一定间隔的元素来进行排序&am…

阅读更多...

智能水果保鲜度检测：基于YOLO和深度学习的完整实现

智能水果保鲜度检测：基于YOLO和深度学习的完整实现

引言水果新鲜程度直接影响其口感和营养价值。为了提高水果品质管理的效率和准确性，本文介绍了一种基于深度学习的水果新鲜程度检测系统。该系统包括用户界面，利用YOLO（You Only Look Once）v8/v7/v6/v5模型进行水果新鲜程度检测&…

阅读更多...

RocketMQ中概念知识点记录和与SpringBoot集成实现发送同步、异步、延时、批量、tag、key、事务消息等

RocketMQ中概念知识点记录和与SpringBoot集成实现发送同步、异步、延时、批量、tag、key、事务消息等

1. 消息模型消息（Message）: 是 RocketMQ 中数据传输的基本单位，由主题、标签、键值、消息体等组成。主题（Topic）: 消息的分类，类似于邮件的主题，用于对消息进行粗粒度的分类。标签&#xff08…

阅读更多...

Zookeeper是什么，为什么要用，怎么用？

Zookeeper是什么，为什么要用，怎么用？

关于Zookeeper的全面了解与应用前言：这几天在开发过程中，遇到了zk相关的一些问题，大体先复习下 Zookeeper作为分布式系统中的协调服务，起着至关重要的角色。本篇文章将从以下几个方面详细讲解什么是Zookeeper，为什么…

阅读更多...

【Go系列】RPC和grpc

【Go系列】RPC和grpc

承上启下介绍完了Go怎么实现RESTFul api，不可避免的，今天必须得整一下rpc这个概念。rpc是什么呢，很多人都想把rpc和http一起对比，但是他们不是一个概念。RPC是一种思想，可以基于tcp，可以基于udp也可以基于…

阅读更多...

【STM32嵌入式系统设计与开发---拓展】——1_10矩阵按键

【STM32嵌入式系统设计与开发---拓展】——1_10矩阵按键

这里写目录标题 1、矩阵按键2、代码片段分析 1、矩阵按键通过将4x4矩阵按键的每一行依次设为低电平，同时保持其它行为高电平，然后读取所有列的电平状态，可以检测到哪个按键被按下。如果某列变为低电平，说明对应行和列的按键被按下…

阅读更多...

Android焦点之FocusWindow切换流程

Android焦点之FocusWindow切换流程

关键调用是setInputWindows InputDispatcher::dispatchFocusLocked：在这里打印日志"Focus entering" 或 "Focus leaving" SurfaceFlinger::updateInputFlingernotifyWindowInfos();mWindowInfosListenerInvoker->windowInfosChanged(windo…

阅读更多...

深度学习落地实战：识别火车票信息

深度学习落地实战：识别火车票信息

前言大家好，我是机长本专栏将持续收集整理市场上深度学习的相关项目，旨在为准备从事深度学习工作或相关科研活动的伙伴，储备、提升更多的实际开发经验，每个项目实例都可作为实际开发项目写入简历，且都附带完整的代码与数据集。可通过百度云盘进行获取，实现开箱即用 …

阅读更多...

高阶面试-hw算法整理

高阶面试-hw算法整理

坚持最近一个星期把每道题搞熟悉文章目录 1154一年中的第几天[125. 验证回文串](https://leetcode.cn/problems/valid-palindrome/)[344. 反转字符串](https://leetcode.cn/problems/reverse-string/)[20. 有效的括号](https://leetcode.cn/problems/valid-parentheses/)[392.…

阅读更多...

【Java】详解抽象类和接口的区别

【Java】详解抽象类和接口的区别

一、抽象类和接口的主要区别表格特性抽象类接口声明关键字abstractinterface声明访问修饰符public、protected、default（不能用private）public、default继承关键字extendsimplements变量跟普通类一样，可以包含实例变量、静态变量等只能包含…

阅读更多...

excel表怎么增乱序单词表和正序单词表四六级要来了？！Excel帮你构建自己的单词库

excel表怎么增乱序单词表和正序单词表四六级要来了？！Excel帮你构建自己的单词库

excel表怎么增乱序单词表和正序单词表四六级要来了？！Excel帮你构建自己的单词库 1.背单词的第一步，当然是先上网找电子版的单词集。盘搜搜 2. 建立 xls 格式的表格 3. 把下载的单词数据复制到表格粘贴 4.新建一列辅助列生成随机数来…

阅读更多...

murmurhash3算法的go语言实现

murmurhash3算法的go语言实现

MurmurHash的定义 MurmurHash 是一种非加密型哈希函数，适用于一般的哈希检索操作。由Austin Appleby在2008年发明，并出现了多个变种，都已经发布到了公有领域(public domain)。与其它流行的哈希函数相比，对于规律性较强的key&…

阅读更多...

网络编程-TCP/IP

网络编程-TCP/IP

网络概述网络采用分而治之的方法设计，将网络的功能划分为不同的模块，以分层的形式有机组合在一起。每层实现不同的功能，其内部实现方法对外部其他层次来说是透明的。每层向上层提供服务，同时使用下层提供的服务网络体系结构…

阅读更多...

SpringMVC注解全解析：构建高效Web应用的终极指南 (上)

SpringMVC注解全解析：构建高效Web应用的终极指南 (上)

SpringMVC 是一个强大的 Web 框架，广泛应用于 Java Web 开发中。它通过注解简化了配置，增强了代码的可读性。本文将全面解析 SpringMVC 中常用的注解及其用法，帮助你构建高效的 Web 应用。一. MVC介绍 MVC 是 Model View Controller 的缩写…

阅读更多...

数字通云平台智慧政务OA PayslipUser SQL注入漏洞复现

数字通云平台智慧政务OA PayslipUser SQL注入漏洞复现

0x01 产品简介数字通云平台智慧政务OA产品是基于云计算、大数据、人工智能等先进技术，为政府部门量身定制的智能化办公系统。该系统旨在提高政府部门的办公效率、协同能力和信息资源共享水平，推动电子政务向更高层次发展。 0x02 漏洞概述数字通云平台智慧政务OA Paysli…

阅读更多...

最新文章