理解CNN中的Batch Normalization （补充知乎博主）

理解CNN中的Batch Normalization （补充知乎博主）

bicheng/2025/7/3 17:09:39/文章来源:https://blog.csdn.net/weixin_45840973/article/details/140389273

理解CNN中的Batch Normalization - 知乎 (zhihu.com)

https://zhuanlan.zhihu.com/p/403073810

BN层常见有针对1d特征（全连接层后面的）

举一个简单的例子吧解释在全连接层（Fully Connected Layer, FC Layer）后加 BN 层时，如何计算均值和方差。

假设有一个全连接层的输出（一个 batch）如下：

$X = \begin{bmatrix} x_1^{(1)} x_2^{(1)} x_3^{(1)} \\ x_1^{(2)} x_2^{(2)} x_3^{(2)} \\ x_1^{(3)} x_2^{(3)}x_3^{(3)} \\ x_1^{(4)} x_2^{(4)} x_3^{(4)} \end{bmatrix}$ $X = \begin{bmatrix} x_1^{(1)} & x_2^{(1)} & x_3^{(1)} \\ x_1^{(2)} & x_2^{(2)} & x_3^{(2)} \\ x_1^{(3)} & x_2^{(3)} & x_3^{(3)} \\ x_1^{(4)} & x_2^{(4)} & x_3^{(4)} \end{bmatrix}$

这里，有 4 个样本（batch size = 4），每个样本有 3 个特征（feature dim = 3）。

计算均值和方差

对于每一个特征维度（每一列），分别计算均值和方差：

计算均值：

计算方差：

最后，通过 γ和 β 进行重新缩放和平移。比如，如果 γ1=1 和 β1=0，那么最终的输出就是标准化后的值；如果 γ1 和 β1是其他值，那么输出会相应地进行缩放和平移。

为什么需要可学习参数 γ 和 β？

虽然标准化可以使得特征的分布更加稳定，但对于深层神经网络而言，仅仅依赖标准化可能会限制模型的表达能力。因此，通过引入γ 和 β，我们可以让模型在保持数值稳定的前提下，灵活地学习到特征的最佳尺度和偏移，从而提高整体性能。

通过反向传播算法，BN 层的参数γ 和 β可以逐步优化，使得神经网络在训练过程中不仅能标准化特征，还能通过调整特征的尺度和偏移来更好地拟合数据，从而提高模型的表现。

神经网络中的其他参数（如权重和偏置）一样。以下是具体的学习过程：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/bicheng/45659.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

基于Adaboost的数据分类算法matlab仿真

基于Adaboost的数据分类算法matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 5.完整程序 1.程序功能描述基于Adaboost的数据分类算法matlab仿真,分别对比线性分类和非线性分类两种方式。 2.测试软件版本以及运行结果展示 MATLAB2022A版本运行 （完整程序…

阅读更多...

京鸿鑫源元宇宙革新探索：开启未来零售新纪元

京鸿鑫源元宇宙革新探索：开启未来零售新纪元

随着科技的不断演进，元宇宙这一概念已成为科技领域的热门话题。作为中国零售业的佼佼者，京鸿鑫源零售公司正积极拥抱元宇宙技术，为用户带来前所未有的购物体验。本文将探讨京鸿鑫源如何在元宇宙领域进行创新实践，以及这些实践如何…

阅读更多...

网络安全那些梗

网络安全那些梗

网络安全领域的梗往往以幽默、讽刺或夸张的方式反映了该领域的某些现象、挑战或误解。以下是一些网络安全相关的梗： 关掉服务器是最有效的安全方法：这个梗源自一个笑话，讲述了一位程序员因误解妻子的话而只买了一个包子回家，随后被…

阅读更多...

redis高性能得原因

redis高性能得原因

Redis 之所以能够实现高性能和快速响应，主要归功于以下几个关键因素： ### 1. 内存存储 Redis 将所有数据存储在内存中，而不是磁盘上。内存的读写速度远远快于磁盘，因此 Redis 的数据访问速度非常快。 ### 2. 单线程模型 Redis 使…

阅读更多...

C++：strcut与class的区别

C++：strcut与class的区别

在C中，struct和class在语法上非常相似，但它们之间确实存在一些关键的差异，这些差异主要体现在成员的默认访问权限和继承的默认方式上。然而，从更广泛的角度来看，它们都可以用来定义自定义数据类型，包含数据…

阅读更多...

更新商品前端接口编写

更新商品前端接口编写

文章目录新增页面书写写表单价格符号的显示然后状态的书写后端枚举书写时间书写使用组件新增页面书写书写直接复制页面写表单的绑定信息然后绑定表单表单绑定还有表单数据的绑定标签中ref的作用就是将该组件注册到vue对象的ref属性中那么在vue运行的时候,会加载所…

阅读更多...

fullcalendar基础使用

fullcalendar基础使用

fullcalendar日历插件，下面是实现的一个基础模版实现任务的添加修改操作。 <div><div id"calendar" ref"calendarRef"></div><el-dialogv-model"dialogTableVisible"title"添加任务"width"500&…

阅读更多...

利用PaddleOCR进行图片的跨页表格提取与合并（PDF扫描版）

利用PaddleOCR进行图片的跨页表格提取与合并（PDF扫描版）

利用PaddleOCR进行扫描版PDF的跨页表格提取与合并前言1.环境准备2.文件路径与阈值设置3.定义辅助函数4.处理PDF文件5.总结前言在处理PDF文件中的表格时，常常会遇到表格跨页的情况。并且一些PDF文件为扫描版。这种情况下，如果要将跨页的表格合并为一个…

阅读更多...

php将png转为jpg，可设置压缩率

php将png转为jpg，可设置压缩率

/** * 将PNG文件转换为JPG文件 * param $pngFilePath string PNG文件路径 * param $jpgFilePath string JPG文件路径 * param $quality int JPG质量,0-100,值越低，压缩率越高 * return void * throws Exception */ function convertPngToJpg($pngFilePath, $jpgFile…

阅读更多...

Golang：数据科学领域中的高性能并发编程新星

Golang：数据科学领域中的高性能并发编程新星

文章目录 📖 介绍 📖🏡 演示环境 🏡📒 文章内容 📒📝 并发性能的卓越表现📝 系统级工具的便捷性📝 语言设计的简洁性📝 强类型系统的严格性📝 版本兼容性的稳定性📝 内置工具的全面性⚓️ 相关链接 ⚓️📖 介绍 📖 在数据科学和机器学习的广阔天地…

阅读更多...

Web3 社交领域的开发技术

Web3 社交领域的开发技术

Web3 社交领域的开发技术主要包括以下几种，随着 Web3 技术的不断发展，Web3 社交领域将会出现更多新的技术和应用场景。北京木奇移动技术有限公司，专业的软件外包开发公司，欢迎交流合作。 1. 区块链技术区块链技术是 Web3 社交的…

阅读更多...

Arcgis横向图例设置

Arcgis横向图例设置

想把这个图例改成横向的点击图例的属性，找到样式

阅读更多...

Sklearn 入门教程：开启机器学习之旅

Sklearn 入门教程：开启机器学习之旅

一、引言在当今数据驱动的时代，机器学习已经成为解决各种实际问题的强大工具。Scikit-learn（简称 sklearn）是 Python 中广泛使用的机器学习库，它提供了丰富的算法和工具，使得构建和训练机器学习模型变得简单而高效。本…

阅读更多...

虚幻引擎ue5游戏运行界面白茫茫一片，怎么处理

虚幻引擎ue5游戏运行界面白茫茫一片，怎么处理

根剧下图顺序即可调节游戏运行界面光照问题： 在大纲里找到post，然后选中它，找到Exposure 把最低亮度和最高亮度的0改为1即可

阅读更多...

C# Winform 系统方案目录的管理开发

C# Winform 系统方案目录的管理开发

在做一个中等复杂程度项目时，我们通常有系统全局配置，还要有对应的方案目录的管理和更新。比如我们有如下需求：开发一个方案管理，可以新建、打开和保存方案，同时还需要保存方案中的各种文件。我设计的采用目录管理和…

阅读更多...

在Linux上部署Java项目过程

在Linux上部署Java项目过程

文章目录 1、ps -ef | grep java2、杀死指定的.jar程序3、此时再查看java进程4、找到.jar包在linux上存储的位置5、切换到存放.jar目录5、把相应的.jar包放入这个目录6、启动指定的java程序 1、ps -ef | grep java [rootiZuf6332h890vozldoxcprZ bailian]# ps -ef | grep java…

阅读更多...

fastadmin 如何通过权限组来控制列的显示与隐藏

fastadmin 如何通过权限组来控制列的显示与隐藏

方法1 以版本控制（application/admin/controller/Version.php）为例子需求就是在有时候，有些列不想让这个权限组的人看到，只给制定的权限组的人看 1.给权限组创建一个字段 ALTER TABLE lt_auth_group ADD COLUMN isBoothView T…

阅读更多...

IDEA 中的调试方式(以 java 为例)

IDEA 中的调试方式(以 java 为例)

文章目录 IDEA 中的调试方式(以 java 为例)1. 基本介绍2. 断点调试的快捷键2.1 设置断点并启动调试2.3 快捷键 IDEA 中的调试方式(以 java 为例) 在开发中查找错误的时候，我们可以用断点调试，一步一步的看源码执行的过程，从而发现错误所在。 …

阅读更多...

如何在QGC中接收和处理无人机上传的各种传感器数据（如GPS、IMU等）。

如何在QGC中接收和处理无人机上传的各种传感器数据（如GPS、IMU等）。

在 QGroundControl (QGC) 中接收和处理无人机上传的各种传感器数据（如 GPS、IMU 等），主要通过 MAVLink 协议实现。MAVLink 是一种轻量级的消息传输协议，用于无人机和地面站之间的通信。QGC 通过 MAVLink 消息接收来自无人机的传感…

阅读更多...

iPhone删除所有照片的高效三部曲

iPhone删除所有照片的高效三部曲

苹果手机用久了，系统缓存包括自己使用手机留下的内存肯定会越来越多。其中，相册中的照片数量可能会急剧增加，占据大量的存储空间。当用户们想要对相册进行彻底清理，实现iPhone删除所有照片时，不妨跟随以下详细的三部曲…

阅读更多...

最新文章