P20类神经网络训练不起来怎么办?- 批次和动量

  • 什么是batch
  • small batch 和 large batch 的比较 : large batch 更快,small batch 在训练集和测试集上效果效果更好
  • 动量的意义和作用: 类似于物理上多了一点惯性,防止困在鞍点。 动量是之前所有梯度的加权和。
    在这里插入图片描述

1. batch 是什么

没一轮epoch 都会分batch , 每次batch 都不一样— shuffle
在这里插入图片描述

2. 为什么training 时要batch

batch 给training 带来了什么帮助?
如 batch = 20 和 batch_size =1
前者看完20个资料后更新参数
后者每看完一笔参数后,就更新参数。 只看一笔参数就更新参数的话,noise 更多,参数更新更加曲曲折折。

针对这个看起来:

  • 前者冷却时间长,准
  • 后者蓄力时间段,不准
    cpu : 在这里插入图片描述
    gpu 上并行计算:
    在这里插入图片描述

Small Batch vs. Large Batch

然而,当考虑到 并行运行时, larger batch 不一定运行的时间更长.
当使用gpu 并行计算时,时间可能会变短。
但是,batch 也不能非常大, 太大的话 ,计算时间会增加很多
在这里插入图片描述
在这里插入图片描述

  • batch_size 和 epoch 运行时间比较

对正确率的影响

问题: batch_size 越大,正确率越低在这里插入图片描述
在这里插入图片描述

  • small batch 正确率更高
    在这里插入图片描述
    使用small batch 时,训练更不容易陷入局部最优。

  • testing 时 small_batch 的结果更好

在这里插入图片描述

总结

在这里插入图片描述

Momentum 动量

在这里插入图片描述
从物理角度,有动量的话,不会停留在鞍点处

一般的梯度

往梯度反方向前进
在这里插入图片描述

Gradient Descent+ Momemt

m 是过去所有 gradient 的加权总和
在这里插入图片描述
momvent 比纯粹gd 多往前走一点
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/225081.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高压电气是什么

高压电气 电工电气百科 文章目录 高压电气前言一、高压电气是什么二、高压电气的类别三、高压电气的作用原理总结前言 高压电气在电力系统中起着重要的作用,它能够将电能有效地输送和分配到各个用户,为社会和工业生产提供稳定可靠的电力供应。然而,高压电气系统也需要注意安…

Python【Matplotlib】鼠标单击事件判断点击的是否为图例

直接上代码: import matplotlib.pyplot as plt# 创建一个简单的图表 fig, ax plt.subplots() line, ax.plot([1, 2, 3], labelLine 1) ax.legend(draggableTrue)# 获取图例对象 legend ax.get_legend()# 获取图例的边界框 legend_bbox legend.get_window_exten…

Mr_HJ / form-generator项目文档学习与记录(续)

以后主打超融开源社区 (jiangzhicheng88) - Gitee.com render.js就是对vue的render函数的自己简单定制封装。 render.js实现的功能是将json表单中的__config__.tag解析为具体的vue组件; 正常开发流程我们组件输入的时候会触发组件内的 this.$emit(getValue, val)…

PyQt6 安装Qt Designer

前言:在Python自带的环境下,安装Qt Designer,并在PyCharm中配置designer工具。 在项目开发中,使用Python虚拟环境安装PyQt6-tools时,designer.exe会安装在虚拟环境的目录中:.venv\Lib\site-packages\qt6_a…

【PHP】openssl_encrypt、openssl_decrypt对称加密解密

目录 1.加密解密封装类 2.调用方法 3.打印结果 1.加密解密封装类 <?php namespace app\common\library;/*** AES加解密* Class Client* package common\components\wsd*/ class Aes {const KEY "xxxxxxxxxxxx";const CIPHER "AES-128-CBC";/*** 加…

新时代商业市场:AR技术的挑战与机遇并存

随着科技的不断发展&#xff0c;增强现实&#xff08;AR&#xff09;技术逐渐成为当今社会的一个重要组成部分。AR技术能够将虚拟世界与现实世界相结合&#xff0c;为人们提供更加丰富、多样化的体验。在新时代的社会商业市场中&#xff0c;AR技术也正逐渐被应用于各种商业活动…

Future设计模式

Future设计模式&#xff0c;针对长时间执行任务场景&#xff0c;提供了一种凭据式解决方案。Future提供了获取计算结果和判断是否完成的两个方法&#xff0c;其中获取计算结果将会导致调用阻塞&#xff08;在任务未完成的情况下&#xff09;。 示例代码如下&#xff1a; publi…

NPM开发工具的简介和使用方法及代码示例

NPM&#xff08;Node Package Manager&#xff09;是Node.js的包管理工具&#xff0c;用于管理和共享被发布到模块仓库的JavaScript代码。本文将介绍NPM的定义、使用方法、代码示例以及总结。 一、NPM的定义 NPM是Node.js的默认包管理工具&#xff0c;它的功能包括安装、管理、…

HTTP超文本传输协议

HTTP协议 概述名词媒体类型URL语法HTTP报文组成HTTP报文语法HTTP请求方法HTTP状态码 概述 HTTP&#xff08;Hypertext transfer protocol&#xff09;超文本传输协议是Web浏览器&#xff0c;服务器和相关的web应用程序相互通信的基石。HTTP使用的是可靠数据传输协议确保数据在…

机器学习算法---回归

1. 线性回归&#xff08;Linear Regression&#xff09; 原理&#xff1a; 通过拟合一个线性方程来预测连续响应变量。线性回归假设特征和响应变量之间存在线性关系&#xff0c;并通过最小化误差的平方和来优化模型。优点&#xff1a; 简单、直观&#xff0c;易于理解和实现。…

C#学习相关系列之数据类型类的定义(一)

一、类的定义 C#中类是一种引用类型&#xff0c;用于表示具有状态和行为的对象。类可以包含字段、属性、方法、事件等成员。 public class MyClass { // 类的成员定义 } 常用的关键字如下&#xff1a; 1、public 是一个访问修饰符&#xff0c;用于指定类成员的访问级…

【日常笔记】notepad++ 正则表达式基本用法

一、场景 二、正则表达式--语法 2.1、学习基本的匹配字符&#xff1a; 2.2、学习特殊字符和量词&#xff1a; 2.3、学习转义字符 2.4、学习分组和捕获 2.5、区分大小写 和 匹配整个单词 2.6、引用分组 三、实战 ▶ 希望把课程目录中 -- 前面的都去掉 一、场景 希望把…

Jrebel 在 Idea 2023.3中无法以 debug 的模式启动问题

Jrebel 在 Idea 2023.3中无法以 debug 的模式启动问题 Idea 在升级了2023.3以后&#xff0c;Jrebel 无法以 debug 的模式启动&#xff0c;找了半天&#xff0c;最后在插件主页的评论区找到了解决方案 特此记录一下

Dockerfile:创建镜像,创建自定义的镜像。

Docker的创建镜像的方式&#xff1a; 基于已有镜像进行创建。 根据官方提供的镜像源&#xff0c;创建镜像&#xff0c;然后拉起容器。是一个白板&#xff0c;只能提供基础的功能&#xff0c;扩展性的功能还是需要自己定义&#xff08;进入容器进行操作&#xff09; 基于模板进…

如何使用Composer安装第三方库?

Composer 是 PHP 的一个依赖管理工具&#xff0c;用于管理项目中的依赖库&#xff08;包&#xff09;。以下是使用 Composer 安装第三方库的一般步骤&#xff1a; 步骤&#xff1a; 安装 Composer&#xff1a; 如果尚未安装 Composer&#xff0c;请按照 Composer 官方网站 上的…

SpringBoot 基础概念:SpringApplication#getSpringFactoriesInstances

SpringBoot 基础概念&#xff1a;SpringApplication#getSpringFactoriesInstances SpringApplication#getSpringFactoriesInstances SpringApplication#getSpringFactoriesInstances private <T> Collection<T> getSpringFactoriesInstances(Class<T> type,…

在 Spring Boot 中发送邮件简单实现

Spring Boot 对于发送邮件这种常用功能也提供了开箱即用的 Starter&#xff1a;spring-boot-starter-mail。 通过这个 starter&#xff0c;只需要简单的几行配置就可以在 Spring Boot 中实现邮件发送&#xff0c;可用于发送验证码、账户激活等等业务场景。 本文将通过实际的案…

【AI美图】第03期效果图,AI人工智能全自动绘画,二次元美图欣赏

带来一组二次元人工智能自动绘图 对比分析&#xff1a; 标题手画二次元需要技巧&#xff1a; 二次元高清图片的绘制技巧主要包括以下几点&#xff1a; 线条的运用&#xff1a;在二次元风格的绘画中&#xff0c;线条的运用非常重要。要绘制出流畅、细腻的线条&#xff0c;需…

用于自动驾驶的基于深度学习的图像 3D 物体检测:综述

论文地址&#xff1a;https://ieeexplore.ieee.org/abstract/document/10017184/ 背景 准确、鲁棒的感知系统是理解自动驾驶和机器人驾驶环境的关键。自动驾驶需要目标的 3D 信息&#xff0c;包括目标的位置和姿态&#xff0c;以清楚地了解驾驶环境。 摄像头传感器因其颜色和…

初识JVM底层知识,一文读懂JVM知识文集。

&#x1f3c6;作者简介&#xff0c;普修罗双战士&#xff0c;一直追求不断学习和成长&#xff0c;在技术的道路上持续探索和实践。 &#x1f3c6;多年互联网行业从业经验&#xff0c;历任核心研发工程师&#xff0c;项目技术负责人。 &#x1f389;欢迎 &#x1f44d;点赞✍评论…