P20类神经网络训练不起来怎么办？- 批次和动量

P20类神经网络训练不起来怎么办？- 批次和动量

news/2025/7/6 16:00:58/文章来源:https://blog.csdn.net/weixin_39107270/article/details/134998618

什么是batch
small batch 和 large batch 的比较： large batch 更快，small batch 在训练集和测试集上效果效果更好
动量的意义和作用：类似于物理上多了一点惯性，防止困在鞍点。动量是之前所有梯度的加权和。

1. batch 是什么

没一轮epoch 都会分batch ，每次batch 都不一样— shuffle
在这里插入图片描述

2. 为什么training 时要batch

batch 给training 带来了什么帮助？
如 batch = 20 和 batch_size =1
前者看完20个资料后更新参数
后者每看完一笔参数后，就更新参数。只看一笔参数就更新参数的话，noise 更多，参数更新更加曲曲折折。

针对这个看起来：

前者冷却时间长，准
后者蓄力时间段，不准
cpu :
gpu 上并行计算：

Small Batch vs. Large Batch

然而，当考虑到并行运行时， larger batch 不一定运行的时间更长.
当使用gpu 并行计算时，时间可能会变短。
但是，batch 也不能非常大，太大的话，计算时间会增加很多
在这里插入图片描述

batch_size 和 epoch 运行时间比较

对正确率的影响

问题： batch_size 越大，正确率越低在这里插入图片描述

small batch 正确率更高

使用small batch 时，训练更不容易陷入局部最优。
testing 时 small_batch 的结果更好

在这里插入图片描述

总结

在这里插入图片描述

Momentum 动量

在这里插入图片描述
从物理角度，有动量的话，不会停留在鞍点处

一般的梯度

往梯度反方向前进
在这里插入图片描述

Gradient Descent+ Momemt

m 是过去所有 gradient 的加权总和
在这里插入图片描述
momvent 比纯粹gd 多往前走一点

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/225081.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

高压电气是什么

高压电气是什么

高压电气电工电气百科文章目录高压电气前言一、高压电气是什么二、高压电气的类别三、高压电气的作用原理总结前言高压电气在电力系统中起着重要的作用，它能够将电能有效地输送和分配到各个用户，为社会和工业生产提供稳定可靠的电力供应。然而，高压电气系统也需要注意安…

阅读更多...

Python【Matplotlib】鼠标单击事件判断点击的是否为图例

Python【Matplotlib】鼠标单击事件判断点击的是否为图例

直接上代码： import matplotlib.pyplot as plt# 创建一个简单的图表 fig, ax plt.subplots() line, ax.plot([1, 2, 3], labelLine 1) ax.legend(draggableTrue)# 获取图例对象 legend ax.get_legend()# 获取图例的边界框 legend_bbox legend.get_window_exten…

阅读更多...

Mr_HJ / form-generator项目文档学习与记录（续）

Mr_HJ / form-generator项目文档学习与记录（续）

以后主打超融开源社区 (jiangzhicheng88) - Gitee.com render.js就是对vue的render函数的自己简单定制封装。 render.js实现的功能是将json表单中的__config__.tag解析为具体的vue组件； 正常开发流程我们组件输入的时候会触发组件内的 this.$emit(getValue, val)…

阅读更多...

PyQt6 安装Qt Designer

PyQt6 安装Qt Designer

前言：在Python自带的环境下，安装Qt Designer，并在PyCharm中配置designer工具。在项目开发中，使用Python虚拟环境安装PyQt6-tools时，designer.exe会安装在虚拟环境的目录中：.venv\Lib\site-packages\qt6_a…

阅读更多...

【PHP】openssl_encrypt、openssl_decrypt对称加密解密

【PHP】openssl_encrypt、openssl_decrypt对称加密解密

目录 1.加密解密封装类 2.调用方法 3.打印结果 1.加密解密封装类 <?php namespace app\common\library;/*** AES加解密* Class Client* package common\components\wsd*/ class Aes {const KEY "xxxxxxxxxxxx";const CIPHER "AES-128-CBC";/*** 加…

阅读更多...

新时代商业市场：AR技术的挑战与机遇并存

新时代商业市场：AR技术的挑战与机遇并存

随着科技的不断发展，增强现实（AR）技术逐渐成为当今社会的一个重要组成部分。AR技术能够将虚拟世界与现实世界相结合，为人们提供更加丰富、多样化的体验。在新时代的社会商业市场中，AR技术也正逐渐被应用于各种商业活动…

阅读更多...

Future设计模式

Future设计模式

Future设计模式，针对长时间执行任务场景，提供了一种凭据式解决方案。Future提供了获取计算结果和判断是否完成的两个方法，其中获取计算结果将会导致调用阻塞（在任务未完成的情况下）。示例代码如下： publi…

阅读更多...

NPM开发工具的简介和使用方法及代码示例

NPM开发工具的简介和使用方法及代码示例

NPM（Node Package Manager）是Node.js的包管理工具，用于管理和共享被发布到模块仓库的JavaScript代码。本文将介绍NPM的定义、使用方法、代码示例以及总结。一、NPM的定义 NPM是Node.js的默认包管理工具，它的功能包括安装、管理、…

阅读更多...

HTTP超文本传输协议

HTTP超文本传输协议

HTTP协议概述名词媒体类型URL语法HTTP报文组成HTTP报文语法HTTP请求方法HTTP状态码概述 HTTP（Hypertext transfer protocol）超文本传输协议是Web浏览器，服务器和相关的web应用程序相互通信的基石。HTTP使用的是可靠数据传输协议确保数据在…

阅读更多...

机器学习算法---回归

机器学习算法---回归

1. 线性回归（Linear Regression） 原理： 通过拟合一个线性方程来预测连续响应变量。线性回归假设特征和响应变量之间存在线性关系，并通过最小化误差的平方和来优化模型。优点： 简单、直观，易于理解和实现。…

阅读更多...

C#学习相关系列之数据类型类的定义（一）

C#学习相关系列之数据类型类的定义（一）

一、类的定义 C#中类是一种引用类型，用于表示具有状态和行为的对象。类可以包含字段、属性、方法、事件等成员。 public class MyClass { // 类的成员定义 } 常用的关键字如下： 1、public 是一个访问修饰符，用于指定类成员的访问级…

阅读更多...

【日常笔记】notepad++ 正则表达式基本用法

【日常笔记】notepad++ 正则表达式基本用法

一、场景二、正则表达式--语法 2.1、学习基本的匹配字符： 2.2、学习特殊字符和量词： 2.3、学习转义字符 2.4、学习分组和捕获 2.5、区分大小写和匹配整个单词 2.6、引用分组三、实战 ▶ 希望把课程目录中 -- 前面的都去掉一、场景希望把…

阅读更多...

Jrebel 在 Idea 2023.3中无法以 debug 的模式启动问题

Jrebel 在 Idea 2023.3中无法以 debug 的模式启动问题

Jrebel 在 Idea 2023.3中无法以 debug 的模式启动问题 Idea 在升级了2023.3以后，Jrebel 无法以 debug 的模式启动，找了半天，最后在插件主页的评论区找到了解决方案特此记录一下

阅读更多...

Dockerfile：创建镜像，创建自定义的镜像。

Dockerfile：创建镜像，创建自定义的镜像。

Docker的创建镜像的方式： 基于已有镜像进行创建。根据官方提供的镜像源，创建镜像，然后拉起容器。是一个白板，只能提供基础的功能，扩展性的功能还是需要自己定义（进入容器进行操作） 基于模板进…

阅读更多...

如何使用Composer安装第三方库？

如何使用Composer安装第三方库？

Composer 是 PHP 的一个依赖管理工具，用于管理项目中的依赖库（包）。以下是使用 Composer 安装第三方库的一般步骤： 步骤： 安装 Composer： 如果尚未安装 Composer，请按照 Composer 官方网站上的…

阅读更多...

SpringBoot 基础概念：SpringApplication#getSpringFactoriesInstances

SpringBoot 基础概念：SpringApplication#getSpringFactoriesInstances

SpringBoot 基础概念：SpringApplication#getSpringFactoriesInstances SpringApplication#getSpringFactoriesInstances SpringApplication#getSpringFactoriesInstances private <T> Collection<T> getSpringFactoriesInstances(Class<T> type,…

阅读更多...

在 Spring Boot 中发送邮件简单实现

在 Spring Boot 中发送邮件简单实现

Spring Boot 对于发送邮件这种常用功能也提供了开箱即用的 Starter：spring-boot-starter-mail。通过这个 starter，只需要简单的几行配置就可以在 Spring Boot 中实现邮件发送，可用于发送验证码、账户激活等等业务场景。本文将通过实际的案…

阅读更多...

【AI美图】第03期效果图，AI人工智能全自动绘画，二次元美图欣赏

【AI美图】第03期效果图，AI人工智能全自动绘画，二次元美图欣赏

带来一组二次元人工智能自动绘图对比分析： 标题手画二次元需要技巧： 二次元高清图片的绘制技巧主要包括以下几点： 线条的运用：在二次元风格的绘画中，线条的运用非常重要。要绘制出流畅、细腻的线条，需…

阅读更多...

用于自动驾驶的基于深度学习的图像 3D 物体检测：综述

用于自动驾驶的基于深度学习的图像 3D 物体检测：综述

论文地址：https://ieeexplore.ieee.org/abstract/document/10017184/ 背景准确、鲁棒的感知系统是理解自动驾驶和机器人驾驶环境的关键。自动驾驶需要目标的 3D 信息，包括目标的位置和姿态，以清楚地了解驾驶环境。摄像头传感器因其颜色和…

阅读更多...

初识JVM底层知识，一文读懂JVM知识文集。

初识JVM底层知识，一文读懂JVM知识文集。

🏆作者简介，普修罗双战士，一直追求不断学习和成长，在技术的道路上持续探索和实践。 🏆多年互联网行业从业经验，历任核心研发工程师，项目技术负责人。 🎉欢迎 👍点赞✍评论…

阅读更多...

最新文章