【深度学习】神经网络术语：Epoch、Batch Size和迭代

【深度学习】神经网络术语：Epoch、Batch Size和迭代

news/2025/4/4 11:57:25/文章来源:https://blog.csdn.net/qq_15719613/article/details/134574457

batchsize：中文翻译为批大小（批尺寸）。

简单点说，批量大小将决定我们一次训练的样本数目。

batch_size将影响到模型的优化程度和速度。

为什么需要有 Batch_Size :

batchsize 的正确选择是为了在内存效率和内存容量之间寻找最佳平衡。

Batch_Size的取值：

神经网络术语：Epoch、Batch Size和迭代

全批次（蓝色）

如果数据集比较小我们就采用全数据集。全数据集确定的方向能够更好地代表样本总体，从而更准确地朝向极值所在的方向。

注：对于大的数据集我们不能使用全批次，因为会得到更差的结果。

迷你批次（绿色）

选择一个适中的 Batch_Size 值。就是说我们选定一个batch的大小后，将会以batch的大小将数据输入深度学习的网络中，然后计算这个batch的所有样本的平均损失，即代价函数是所有样本的平均。

随机（batch_size等于1的情况）（红色）

每次修正方向以各自样本的梯度方向修正，横冲直撞各自为政，难以达到收敛。

适当的增加Batchsize 的优点：

1.通过并行化提高内存利用率。

2.单次epoch的迭代次数减少，提高运行速度。（单次epoch=（全部训练样本/batchsize） / iteration =1）

3.适当的增加Batch_Size，梯度下降方向准确度增加，训练震动的幅度减小。（看上图便可知晓）

经验总结：

相对于正常数据集，如果Batch_Size过小，训练数据就会非常难收敛，从而导致underfitting。

增大Batch_Size，相对处理速度加快。

增大Batch_Size，所需内存容量增加（epoch的次数需要增加以达到最好结果）。

这里我们发现上面两个矛盾的问题，因为当epoch增加以后同样也会导致耗时增加从而速度下降。因此我们需要寻找最好的batch_size。

再次重申：batchsize 的正确选择是为了在内存效率和内存容量之间寻找最佳平衡。

Iteration: 中文翻译为迭代。

迭代是重复反馈的动作，神经网络中我们希望通过迭代进行多次的训练以到达所需的目标或结果。

每一次迭代得到的结果都会被作为下一次迭代的初始值。

一个迭代 = 一个正向通过+一个反向通过

epoch：中文翻译为时期。

一个时期 = 所有训练样本的一个正向传递和一个反向传递。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/162837.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Postgresql源码（116）提升子查询案例分析

Postgresql源码（116）提升子查询案例分析

0 总结对于SQL：select * from student, (select * from score where sno > 2) s where student.sno s.sno; pullup在pull_up_subqueries函数内递归完成，分几步： 将内层rte score追加到上层rtbable中：rte1是student、rte2带…

阅读更多...

nginx编译安装

nginx编译安装

1.下载nginx： 地址：http://nginx.org/en/download.html 2.安装依赖安装gcc: yum install -y gcc安装pcre库 yum install -y pcre pcre-devel安装zlib库： yum install -y zlib zlib-devel3.安装nginx ./configure --prefix/usr/local/ngi…

阅读更多...

Spark SQL将Hive表中的数据写入到MySQL数据库中

Spark SQL将Hive表中的数据写入到MySQL数据库中

import org.apache.spark.sql.SparkSessionobject HiveToMySQL {def main(args: Array[String]): Unit {// 创建SparkSessionval spark SparkSession.builder().appName("HiveToMySQL").enableHiveSupport().getOrCreate()// 读取Hive表数据val hiveDF spark.tabl…

阅读更多...

一体化大气环境监测设备实时守护我们的空气质量

一体化大气环境监测设备实时守护我们的空气质量

WX-CSQX12 随着空气污染问题的日益严重，大气环境监测设备成为了我们生活中不可或缺的一部分。而一体化的大气环境监测设备，更是为我们的环境保护工作带来了更多的便利和效益。一体化大气环境监测设备是一种集成了多种功能于一体的环保设备，…

阅读更多...

BootStrap【表格二、基础表单、被支持的控件、表单状态】(二)-全面详解（学习总结---从入门到深化）

BootStrap【表格二、基础表单、被支持的控件、表单状态】(二)-全面详解（学习总结---从入门到深化）

目录表格二表单_基础表单表单_被支持的控件表单_表单状态表格二紧缩表格通过添加 .table-condensed 类可以让表格更加紧凑，单元格中的内补（padding）均会减半 <table class"table table-condensed table-bordered"…

阅读更多...

学习量化交易如何入门？

学习量化交易如何入门？

Python 量化入门很简单，只需 3 步就能快速上手! 题主在程序方向没有相关经验，今天就从量化行业的通用语言-Python 着手，教大家如何快速入门。一、准备工作在开始 Python 编程之前，首先需要确保你的计算机上安装了合适的 Pytho…

阅读更多...

【深度学习】Transformer简介

【深度学习】Transformer简介

近年来，Transformer模型在自然语言处理（NLP）领域中横扫千军，以BERT、GPT为代表的模型屡屡屠榜，目前已经成为了该领域的标准模型。同时，在计算机视觉等领域中，Transformer模型也逐渐得到了重视&a…

阅读更多...

【PythonGIS】基于Python面矢量转换线矢量

【PythonGIS】基于Python面矢量转换线矢量

今天有些不一样，发这篇文章并不是项目需要。单纯的想到有这个功能没使用Python实现，所以就去研究了一下，第一时间就和大家分享。如何使用Python的osgeo库实现面矢量数据与线矢量数据的互相转换。一、导入所需库 import os from osgeo impor…

阅读更多...

论文速读《DeepFusion: Lidar-Camera Deep Fusion for Multi-Modal 3D Object Detection》

论文速读《DeepFusion: Lidar-Camera Deep Fusion for Multi-Modal 3D Object Detection》

概括主要内容文章《DeepFusion: Lidar-Camera Deep Fusion for Multi-Modal 3D Object Detection》提出了两种创新技术，以改善多模态3D检测模型的性能，通过更有效地融合相机和激光雷达传感器数据来提高对象检测的准确性，尤其是在行人检测方面…

阅读更多...

自动化提交git

自动化提交git

1.前要这里只是讲解如何在Windows上创建自动化脚本/程序来达到自动pull、commit、push，减少冗余的仓库更新工作，避免在多平台下合作造成版本冲突等。 2.原理使用Windows下默认的cmd/bat脚本编写代码。只需要在网络上查询一些相关的语法&#xff0…

阅读更多...

2023亚太杯数学建模C题思路 - 我国新能源电动汽车的发展趋势

2023亚太杯数学建模C题思路 - 我国新能源电动汽车的发展趋势

1 赛题问题C 我国新能源电动汽车的发展趋势新能源汽车是指以先进技术原理、新技术、新结构的非常规汽车燃料为动力来源( 非常规汽车燃料指汽油、柴油以外的燃料），将先进技术进行汽车动力控制和驱动相结合的汽车。新能源汽车主要包括四种类型&#x…

阅读更多...

【计算思维】蓝桥杯STEMA 科技素养考试真题及解析 6

【计算思维】蓝桥杯STEMA 科技素养考试真题及解析 6

1、明明买了一个扫地机器人，可以通过以下指令控制机器人运动: F:向前走 10 个单位长度 L:原地左转 90 度 R:原地右转 90 度机器人初始方向向右，需要按顺序执行以下那条指令，才能打扫完下图中的道路 A、F-L-F-R-F-F-R-F-L-F B、F-R-F-L-F-F…

阅读更多...

h5如何使用navigateBack回退到微信小程序页面并携带参数

h5如何使用navigateBack回退到微信小程序页面并携带参数

前言在h5中使用navigateBack回退到微信小程序页面很常见，但是有一种交互需要在回退之后的页面可以得到通知，拿到标识之后，进行某些操作，这样的话，由于微信官方并没有直接提供这样的api，就需要我们开动脑筋…

阅读更多...

视频剪辑有妙招：批量置入封面，轻松提升视频效果

视频剪辑有妙招：批量置入封面，轻松提升视频效果

随着社交媒体的兴起，视频已经成为分享和交流的重要方式。无论是专业的内容创作者还是普通的社交媒体用户，都要在视频剪辑上下一番功夫，才能让视频更具吸引力。而一个吸引的封面往往能在一瞬间抓住眼球，提高点击率。还在因如何选择…

阅读更多...

【SpringBoot】Redisson 分布式锁注解和 @Transactional 注解一起使用问题

【SpringBoot】Redisson 分布式锁注解和 @Transactional 注解一起使用问题

一、前言平时使用切面去加分布式锁，是先开启事务还是先尝试获得锁？这两者有啥区别？ 业务中怎么控制切面的顺序？切面的顺序对事务的影响怎么避免？ 下面程序分析： OverrideTransactionalpublic ReceiveH5…

阅读更多...

uni-app - 弹出框

uni-app - 弹出框

目录 1.基本介绍 2.原生uinapp 通过uni.showActionSheet实现 3.使用组件 Popup 弹出层 ③效果展示 1.基本介绍弹出框让我们在需要时在屏幕底部弹出一个菜单，它通常用于在各种应用程序中进行选择操作。Uniapp为我们提供了基本的底部弹出框组件，但它也有…

阅读更多...

OpenSearch开发环境安装Docker和Docker-Compose两种方式

OpenSearch开发环境安装Docker和Docker-Compose两种方式

文章目录简介常用请求创建映射写入数据查询数据其他安装Docker方式安装OpenSearch安装OpenSearchDashboard Docker-Compose方式Docker-Compose安装1.设置主机环境2.下载docker-compose.yml文件3.启动docker-compose4.验证问题问题1：IPv4 forwarding is disabled.…

阅读更多...

如何搭建Zblog网站并通过内网穿透将个人博客发布到公网

如何搭建Zblog网站并通过内网穿透将个人博客发布到公网

文章目录 1. 前言2. Z-blog网站搭建2.1 XAMPP环境设置2.2 Z-blog安装2.3 Z-blog网页测试2.4 Cpolar安装和注册 3. 本地网页发布3.1. Cpolar云端设置3.2 Cpolar本地设置 4. 公网访问测试5. 结语 1. 前言想要成为一个合格的技术宅或程序员，自己搭建网站制作网页是绕…

阅读更多...

Altium Designer学习笔记11

Altium Designer学习笔记11

画一个LED的封装： 使用这个SMD5050的封装。我们先看下这个芯片的功能说明： 5050贴片式发光二极管： XL-5050 是单线传输的三通道LED驱动控制芯片，采用的是单极性归零码协议。数据再生模块的功能，自动将级联输出的数…

阅读更多...

CSGO搬砖干货，全网最详细教学！

CSGO搬砖干货，全网最详细教学！

CSGO游戏搬砖全套操作流程及注意事项（第一课） 在电竞游戏中，CSGO（Counter-Strike: Global Offensive）被广大玩家誉为经典之作。然而，除了在游戏中展现个人实力和团队合作外，有些玩家还将CSGO作为…

阅读更多...

最新文章