pytorch之trainer.zero_grad()

pytorch之trainer.zero_grad()

news/2025/4/21 11:28:58/文章来源:https://blog.csdn.net/yuebowhu/article/details/118099124

在下面的代码中，在每次l.backward()前都要trainer.zero_grad()，否则梯度会累加。

num_epochs = 3
for epoch in range(num_epochs):for X, y in data_iter:l = loss(net(X), y)trainer.zero_grad()l.backward()trainer.step()l = loss(net(features), labels)print(f'epoch {epoch + 1}, loss {l:f}')

trainer.step()在参数迭代的时候是如何知道batch_size的？
因为loss = nn.MSELoss()，均方误差是对样本总量平均过得到的，所以trainer.step()使用的是平均过的grad。
参考资料：

https://zh-v2.d2l.ai/chapter_linear-networks/linear-regression-concise.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/420699.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

前端学习（1173）:两种字符串方法

前端学习（1173）:两种字符串方法

阅读更多...

35款让你爱不释手的网页元素PSD素材

35款让你爱不释手的网页元素PSD素材

网页元素是构成一个网页的基本元素，包括按钮、表单、文本框、进度条等。这里收集了30款让你爱不释手的网页元素PSD素材。 1、国外个性网页模板UI设计PSD素材下载地址>>> 2、带分享按钮的网页导航栏UI设计PSD素材下载地址>>> 3、两款简洁的搜索框…

阅读更多...

Accumulator

Accumulator

class Accumulator: #save"""在n个变量上累加。"""def __init__(self, n):self.data [0.0] * ndef add(self, *args):self.data [a float(b) for a, b in zip(self.data, args)]def reset(self):self.data [0.0] * len(self.data)def __get…

阅读更多...

mogodb能干嘛

mogodb能干嘛

MongoDB 是什么 ? 能干嘛 ？ 1、MongoDB是什么？ 2、为什么要用MongoDB？ 3、主要特性 4、C/S服务模型 5、完善的命令行工具 6、几个shell实操 7、在Java中使用MongoDB 1、MongoDB是什么？ MongoDB是一款为web应用程序和互联网基础设…

阅读更多...

调用父类方法

调用父类方法

1.用inherited;调用父类的构造函数；2.用inherited 函数名（） 调用父类同名非构造函数；转载于:https://www.cnblogs.com/spiritofcloud/p/3898360.html

阅读更多...

ajax上传文件到servlet

ajax上传文件到servlet

js $(function() {// js判断文件大小function findSize(field_id) {let fileInput $("#"field_id)[0];let byteSize fileInput.files[0].size;return ( Math.ceil(byteSize / 1024 / 1024) ); // Size returned in MB.}// 上传图片按钮 <button type"but…

阅读更多...

前端学习（1174）:repeat方法

前端学习（1174）:repeat方法

阅读更多...

DHCP中继

DHCP中继

拓扑如下： R0配置： (config)#ip dhcp pool aaa (dhcp-config)#network 8.8.8.0 255.255.255.0 (dhcp-config)#default-router 8.8.8.1 (dhcp-config)#dns-server 114.114.114.114(config)#ip dhcp pool bbb (dhcp-config)#network 88.88.88.0 255.255.25…

阅读更多...

maven项目，如何导入本地jar包

maven项目，如何导入本地jar包

maven项目导入本地jar包，然后以pom坐标的方式引入项目。为何有这种奇怪的需求？ maven 上找不到了对应的jar包了，没有对应的坐标。导入方式将你本地的项目放入maven仓库，使用maven命令。而不是简单的复制进maven仓库。参数说明&…

阅读更多...

标签管理（转载）

标签管理（转载）

转自：http://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000/0013762144381812a168659b3dd4610b4229d81de5056cc000 发布一个版本时，我们通常先在版本库中打一个标签，这样，就唯一确定了打标签时刻…

阅读更多...

centos7配置jdk1.8环境变量

centos7配置jdk1.8环境变量

目录1. Oracle下载linux版本的jdk2. 上传到linux服务器3. 解压4. 编辑环境变量1. Oracle下载linux版本的jdk https://www.oracle.com/cn/java/technologies/javase/javase-jdk8-downloads.html 2. 上传到linux服务器使用工具 mobaxterm 上传jdk https://mobaxterm.mobatek…

阅读更多...

前端学习（1176）:set数据结构2

前端学习（1176）:set数据结构2

阅读更多...

【iOS开发每日小笔记（二）】gitHub上的开源“瀑布流”使用心得

【iOS开发每日小笔记（二）】gitHub上的开源“瀑布流”使用心得

这篇文章是我的【iOS开发每日小笔记】系列中的一片，记录的是今天在开发工作中遇到的，可以用很短的文章或很小的demo演示解释出来的小心得小技巧。它们可能会给用户体验、代码效率得到一些提升，或是之前自己没有接触过的技术，很开心…

阅读更多...

spring mvc 入门DispatcherServlet转发

spring mvc 入门DispatcherServlet转发

目录一，配置相关二，java类测试三，测试一，配置相关 maven坐标依赖 <dependencies><dependency><groupId>org.springframework</groupId><artifactId>spring-context&…

阅读更多...

web音乐播放器+后台歌曲，歌单管理

web音乐播放器+后台歌曲，歌单管理

项目地址 https://github.com/sevenyoungairye/web_music_palyer技术点 - 基于h5, css3, js, bootstarp, jquery,- 后台基于structs1, spring, spring-jdbcTemplate功能 - 用户curd- 歌单curd，为歌单新增，移除歌曲- 上传歌曲，修改歌曲- 查询…

阅读更多...

前端学习（1178）:vue基础

前端学习（1178）:vue基础

阅读更多...

Oracle WorkFlow（工作流）(一)

Oracle WorkFlow（工作流）(一)

转载自:http://hi.baidu.com/quce227/item/3dee702c66466a0343634a58 1概述 1.1工作流的概念 Workflow是EBS的基础架构技术之一，系统中大部分流程性的通知和审批控制、账户按规则自动生成都是通过Workflow实现的1.2工作流的目的 1． 在业务流程中发送、提…

阅读更多...

spring mvc框架请求注解解析，内部资源视图解析器

spring mvc框架请求注解解析，内部资源视图解析器

请看spring DispatcherServlet入门目录1. RequestMapping2. InternalResourceViewResolver1. RequestMapping 作用：用于建立请求url和处理请求方法之间的对应关系位置：类上，请求url的第一级访问目录。此处不写的话，相当于应用的…

阅读更多...

前端学习（1179）:vue概述

前端学习（1179）:vue概述

阅读更多...

boot-1学习

boot-1学习

Bootstrap-1学习Bootstrap介绍一. 响应式布局(css3的技术)1. 什么是响应式2. 响应式网页必要的要求3.移动设备的适配 --视口-- 这部分在pc端上没用二.Bootstrap1.起步2.全局cssBootstrap介绍 bootrap简称boot,是一个简洁的,直接的,强悍的,直接的一个框架,这是官方对它的描述.主…

阅读更多...

最新文章