5-隐藏层：神经网络为什么working

5-隐藏层：神经网络为什么working

news/2025/4/27 0:44:24/文章来源:https://blog.csdn.net/qq_48185833/article/details/136823085

声明

本文章基于哔哩哔哩付费课程《小白也能听懂的人工智能原理》。仅供学习记录、分享，严禁他用！！如有侵权，请联系删除

目录

一、知识引入

（一）隐藏层

（二）泛化

（三）深度神经网络

二、编程实验

（一）输入x与第一层

（二）上一层的输出结果与第二层

（三）计算前向传播

（四）计算反向传播

（五）完整代码

一、知识引入

小蓝海底的豆豆发生了进化，毒性变得忽大忽小，与豆豆的大小不再有明显的关系，就需要一个有多样单调性的函数来预测，而不是只具有单一不变的单调性。

将神经元组成一个网络：

第一个神经元：先通过线性函数计算，再通过激活函数得到最终的输出，利用梯度下降算法，将输出调整为sigmoid式的样子；

第二个神经元也同样，调整为sigmoid式的样子；

将两个神经元的最终输出作为第三个神经元的输入，先通过第三个神经元的线性函数计算，再通过激活函数+梯度下降算法

即，将输入分为两个部分，然后分别对两个部分进行调节，然后再送入最后一个神经元，让整体的神经网络形成一个单调性不唯一的更多变函数。从而具备了解决更加复杂问题的能力。

添加一个神经元后，相当于增加了一个抽象的维度，把输入放进不同的维度中，每个维度通过不断地调整权重并进行激活，从而产生对输入的不同理解。最后再把这些抽象维度中的输出合并、降维，得到输出。这个输入数据由于在多个抽象维度中被产生不同的解读，从而让输出得到了更多可能。

当环境中的豆豆毒性发生更多可能的时候，同样可以采取类似的方法：通过增加对输入更多的抽象维度，产生更多的解读，从而实现更加复杂的分类效果。

（一）隐藏层

中间新增添加的神经元节点--“隐藏层”。

正是因为隐藏层的存在，才让神经网络能够在复杂情况下仍旧working。

显而易见，隐藏层的神经元数量越多，就可以产生越复杂的组合，解决越复杂的问题。当然计算量也随之越来越大。

（二）泛化

我们采集的训练数据越充足，那么最后训练得到的模型也就能越好的去预测新的问题。因为越充足的训练数据，就在越大程度上蕴藏了问题的规律特征。新的问题数据也就越难以逃脱这些规律的约束。

所以总说，机器学习神经网络的根基是：海量数据。

一个训练后，拟合适当的模型，进而在遇到新的问题数据时，也能大概率产生正确预测。成为“模型的泛化”。泛化能力也是神经网络追求的核心问题。

（三）深度神经网络

隐藏层超过3层的网络。

二、编程实验

（一）输入x与第一层

# 第一层
# 第一个神经元
w11_1 = np.random.rand() # _后表示第几层，11表示第1个输入和第1个神经元
b1_1 = np.random.rand() # _后表示第几层，1表示第一个神经元权重的偏置项# 第二个神经元
w12_1 = np.random.rand() # _后表示第几层，12表示第1个输入和第2个神经元
b2_1 = np.random.rand() # _后表示第几层，2表示第二个神经元权重的偏置项

（二）上一层的输出结果与第二层

# 第二层
w11_2 = np.random.rand() # _后表示第几层，11表示第1个输入和第1个神经元
w21_2 = np.random.rand() # _后表示第几层，21表示第2个输入和第1个神经元
b1_2 = np.random.rand() # _后表示第几层，1表示第一个神经元权重的偏置项

（三）计算前向传播

# 计算前向传播
# 第一层
z1_1 = w11_1 * xs + b1_1
a1_1 = sigmoid(z1_1)
z2_1 = w21_1 * xs + b2_1
a2_1 = sigmoid(z2_1)# 第二层
# 第一层的输出作为输入
z1_2 = w11_2 * a1_1 + w21_2 * a2_1 + b1_2
a1_2 = sigmoid(z1_2)

（四）计算反向传播

# 先来一次前向传播
z1_1, a1_1, z2_1, a2_1, z1_2, a1_2 = forward_propagation(x)
# 反向传播
# 代价函数e
e = (y - a1_2)**2# 代价函数对最终输出求导
deda1_2 = -2 * (y - a1_2)
# 第二层神经元的激活函数求导
da1_2dz1_2 = a1_2 * (1 - a1_2)
# z1_2对两个输入神经元的权重求导，即线性函数的导数
dz1_2dw11_2 = a1_1
dz1_2dw21_2 = a2_1
# 链式法则，得到损失函数e对第二层神经元的两个输入的导数
dedw11_2 = deda1_2 * da1_2dz1_2 * dz1_2dw11_2
dedw21_2 = deda1_2 * da1_2dz1_2 * dz1_2dw21_2
# 第二层神经元的偏置项
dz1_2db1_2 = 1
dedb1_2 = deda1_2 * da1_2dz1_2 *dz1_2db1_2# 对隐藏层的神经元进行操作
# 第一个神经元
# 对权重求导
dz1_2da1_1 = w11_2
# 激活函数求导
da1_1dz1_1 = a1_1 * (1 - a1_1)
# 对权重求导
dz1_1dw11_1 = x
# 链式法则
dedw11_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da1_1dz1_1 * dz1_1dw11_1
# 对偏置项b求导
dz1_1db1_1 = 1
# 链式求导法则
dedb1_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da1_1dz1_1 * dz1_1db1_1# 对第二个神经元
# 对权重求导
dz1_2da2_1 = w21_2
# 激活函数求导
da2_1dz2_1 = a2_1 * (1 - a2_1)
# 对权重求导
dz2_1dw12_1 = x
dedw12_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da2_1dz2_1 * dz2_1dw12_1
# 对偏置项b求导
dz2_1db2_1 = 1
# 链式求导法则
dedb2_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da2_1dz2_1 * dz2_1db2_1alpha = 0.03
# 更新参数
w11_1 = w11_1 - alpha * dedw11_1
w12_1 = w12_1 - alpha * dedw12_1
b1_1 = b1_1 - alpha * dedb1_1w11_2 = w11_2 - alpha * dedw11_2
w21_2 = w21_2 - alpha * dedw21_2
b1_2 = b1_2 - alpha * dedb1_2

（五）完整代码

import dataset
import matplotlib
import numpy as np
from matplotlib import pyplot as plt
# 首先要知道 matplotlib 的 backend 使用的是默认配置 agg （agg不能显示绘制的图），要想显示绘制的图需要更改 agg 为 TkAgg
matplotlib.use('TkAgg')def sigmoid(x):return 1 / (1 + np.exp(-x))# 生成数据
xs, ys = dataset.get_beans(100)
num = 100# 第一层
# 第一个神经元
w11_1 = np.random.rand() # _后表示第几层，11表示第1个输入和第1个神经元
b1_1 = np.random.rand() # _后表示第几层，1表示第一个神经元权重的偏置项
# 第二个神经元
w12_1 = np.random.rand() # _后表示第几层，12表示第1个输入和第2个神经元
b2_1 = np.random.rand() # _后表示第几层，2表示第二个神经元权重的偏置项# 第二层
w11_2 = np.random.rand() # _后表示第几层，11表示第1个输入和第1个神经元
w21_2 = np.random.rand() # _后表示第几层，21表示第2个输入和第1个神经元
b1_2 = np.random.rand() # _后表示第几层，1表示第一个神经元权重的偏置项# 计算前向传播
def forward_propagation(xs):# 第一层z1_1 = w11_1 * xs + b1_1a1_1 = sigmoid(z1_1)z2_1 = w12_1 * xs + b2_1a2_1 = sigmoid(z2_1)# 第二层# 第一层的输出作为输入z1_2 = w11_2 * a1_1 + w21_2 * a2_1 + b1_2a1_2 = sigmoid(z1_2)return z1_1, a1_1, z2_1, a2_1, z1_2, a1_2# 在全部样本上做了5000次梯度下降
for _ in range(5000):for i in range(100):x = xs[i]y = ys[i]# 先来一次前向传播z1_1, a1_1, z2_1, a2_1, z1_2, a1_2 = forward_propagation(x)# 反向传播# 代价函数ee = (y - a1_2)**2# 代价函数对最终输出求导deda1_2 = -2 * (y - a1_2)# 第二层神经元的激活函数求导da1_2dz1_2 = a1_2 * (1 - a1_2)# z1_2对两个输入神经元的权重求导，即线性函数的导数dz1_2dw11_2 = a1_1dz1_2dw21_2 = a2_1# 链式法则，得到损失函数e对第二层神经元的两个输入的导数dedw11_2 = deda1_2 * da1_2dz1_2 * dz1_2dw11_2dedw21_2 = deda1_2 * da1_2dz1_2 * dz1_2dw21_2# 第二层神经元的偏置项dz1_2db1_2 = 1dedb1_2 = deda1_2 * da1_2dz1_2 *dz1_2db1_2# 对隐藏层的神经元进行操作# 第一个神经元# 对权重求导dz1_2da1_1 = w11_2# 激活函数求导da1_1dz1_1 = a1_1 * (1 - a1_1)# 对权重求导dz1_1dw11_1 = x# 链式法则dedw11_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da1_1dz1_1 * dz1_1dw11_1# 对偏置项b求导dz1_1db1_1 = 1# 链式求导法则dedb1_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da1_1dz1_1 * dz1_1db1_1# 对第二个神经元# 对权重求导dz1_2da2_1 = w21_2# 激活函数求导da2_1dz2_1 = a2_1 * (1 - a2_1)# 对权重求导dz2_1dw12_1 = xdedw12_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da2_1dz2_1 * dz2_1dw12_1# 对偏置项b求导dz2_1db2_1 = 1# 链式求导法则dedb2_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da2_1dz2_1 * dz2_1db2_1alpha = 0.03w11_1 = w11_1 - alpha * dedw11_1w12_1 = w12_1 - alpha * dedw12_1b1_1 = b1_1 - alpha * dedb1_1w11_2 = w11_2 - alpha * dedw11_2w21_2 = w21_2 - alpha * dedw21_2b1_2 = b1_2 - alpha * dedb1_2# 减少绘图的频率if _ % 50 == 0:# plt.clf()函数清除绘图窗口plt.clf()# 重新绘制散点图和预测曲线plt.scatter(xs, ys)z1_1, a1_1, z2_1, a2_1, z1_2, a1_2 = forward_propagation(xs)plt.plot(xs, a1_2)# 暂停0.01秒plt.pause(0.01)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/754248.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

深入理解浏览器的页面渲染机制

深入理解浏览器的页面渲染机制

在当今的网络技术日益发展的背景下，网页变得越来越复杂和动态。作为开发者，理解浏览器如何渲染页面对于优化性能、提升用户体验至关重要。本文将深入探讨浏览器的页面渲染过程，包括重排（Reflow）和重绘（Repa…

阅读更多...

【Spring Cloud】SpringCloud接入SOFARegistry

【Spring Cloud】SpringCloud接入SOFARegistry

背景由于项目开发使用的是SpringCloud，但是甲方使用的是阿里云提供的私有云注册中心，需要替换注册中心。方案官方文档：Spring Cloud 使用 SOFARegistry 改造的步骤： 1.去掉原项目中注册中心的pom依赖引入，我们使…

阅读更多...

java算法题每日多道

java算法题每日多道

274. H 指数题目给你一个整数数组 citations ，其中 citations[i] 表示研究者的第 i 篇论文被引用的次数。计算并返回该研究者的 h 指数。根据维基百科上 h 指数的定义：h 代表“高引用次数” ，一名科研人员的 h 指数是指他（…

阅读更多...

鸿蒙Harmony应用开发—ArkTS声明式开发（绘制组件：Ellipse）

鸿蒙Harmony应用开发—ArkTS声明式开发（绘制组件：Ellipse）

椭圆绘制组件。说明： 该组件从API Version 7开始支持。后续版本如有新增内容，则采用上角标单独标记该内容的起始版本。子组件无接口 Ellipse(options?: {width?: string | number, height?: string | number}) 从API version 9开始&#xff0…

阅读更多...

数据结构知识Day1

数据结构知识Day1

数据结构是什么？ 数据结构是计算机存储、组织数据的方式，它涉及相互之间存在一种或多种特定关系的数据元素的集合。数据结构反映了数据的内部构成，即数据由哪些成分数据构成，以何种方式构成，以及呈现何种结构。这种结…

阅读更多...

谷歌发布Bard AI以与ChatGPT/GPT-4竞争

谷歌发布Bard AI以与ChatGPT/GPT-4竞争

Google发布Bard AI，与ChatGPT/GPT-4竞争概述谷歌近日推出了一款名为Bard的创新型AI聊天机器人，旨在与OpenAI的ChatGPT和微软的Bing Chat竞争。与同类产品不同，Bard能够直接从其模型中生成信息，而不是检索搜索结果。Bard被视为…

阅读更多...

LeetCode讲解算法1-排序算法（Python版）

LeetCode讲解算法1-排序算法（Python版）

文章目录一、引言问题提出二、排序算法1.选择排序（Selection Sort）2.冒泡排序3.插入排序（Insertion Sort）4.希尔排序（Shell Sort）5.归并排序（Merge Sort）6.快速排序（Qu…

阅读更多...

【Node.js从基础到高级运用】十三、NodeJS中间件高级应用

【Node.js从基础到高级运用】十三、NodeJS中间件高级应用

在现代web开发中，Node.js因其高效和灵活性而备受青睐。其中，中间件的概念是构建高效Node.js应用的关键。在这篇博客文章中，我们将深入探讨Node.js中间件的高级应用，包括创建自定义中间件、使用第三方中间件等。我们将从基础讲起&a…

阅读更多...

AJAX-原理XMLHttpRequest

AJAX-原理XMLHttpRequest

定义使用查询参数定义：浏览器提供给服务器的额外信息，让服务器返回浏览器想要的数据语法：http://xxxx.com/xxx/xxx?参数名1值1&参数名2值2

阅读更多...

ChatGPT编程Python小案例（拿来就用）—解压zip压缩文件

ChatGPT编程Python小案例（拿来就用）—解压zip压缩文件

ChatGPT编程Python小案例（拿来就用）—解压zip压缩文件今天撸一本书，其中书中提供一个zip压缩文件的资料。下载之后，没有解压软件，（也可能该文件可以自解压）。这段时间已经深刻体会到AI编程带来…

阅读更多...

爬虫 Day2

爬虫 Day2

resp.close()#关掉resp 一requests入门 （一） 用到的网页：豆瓣电影分类排行榜 - 喜剧片 import requestsurl "https://movie.douban.com/j/chart/top_list" #参数太长，重新封装参数 param {"type": "…

阅读更多...

【Unity每日一记】unity中的内置宏和条件编译（Unity内置脚本符号）

【Unity每日一记】unity中的内置宏和条件编译（Unity内置脚本符号）

👨‍💻个人主页：元宇宙-秩沅 👨‍💻 hallo 欢迎点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍💻 本文由秩沅原创 👨‍💻 收录于专栏：uni…

阅读更多...

EDI在汽车主机厂配送流程中的应用

EDI在汽车主机厂配送流程中的应用

汽车主机厂的汽车配送流程始于汽车 “生产结束 ” ，止于 “交付给经销商 ” 。在这个流程中，企业作为主机厂的下游供应商，与主机厂的物流服务供应商之间的信息交换将会变得十分重要。配送流程：运输订单以及报告汽车主机厂提供预…

阅读更多...

【linux驱动】定时器的使用

【linux驱动】定时器的使用

【linux驱动】定时器的使用文章目录【linux驱动】定时器的使用1.介绍1.1相关名词1.2配置HZ的方法 2.API3.示例4.调试 1.介绍 1.1相关名词 HZ、jiffies、tick Linux系统启动后，每隔固定周期就会发出timer interrupt(IRQ 0)，HZ用来定义每一秒发生多少…

阅读更多...

Day50| 123 买卖股票的最佳时机III 188 买卖股票的最佳时机IV

Day50| 123 买卖股票的最佳时机III 188 买卖股票的最佳时机IV

目录 123 买卖股票的最佳时机III 188 买卖股票的最佳时机IV 123 买卖股票的最佳时机III class Solution { public:int maxProfit(vector<int>& prices) {vector<vector<int>> dp(prices.size() 1, vector<int>(5, 0));dp[0][0] 0;dp[0][…

阅读更多...

模块化开发在不同编程语言中的实现方式有何异同？并以LabVIEW为例进行说明

模块化开发在不同编程语言中的实现方式有何异同？并以LabVIEW为例进行说明

模块化开发是一种软件设计方法，它将一个大型程序分解成独立的、可以单独开发和测试的模块或组件。这种方法提高了代码的可重用性、可维护性和可测试性。不同编程语言实现模块化开发的方式各有特色，但都遵循基本的设计原则，如封装、接口抽象和…

阅读更多...

【机器学习】经典目标检测算法：RCNN、Fast RCNN、 Faster RCNN 基本思想和网络结构介绍

【机器学习】经典目标检测算法：RCNN、Fast RCNN、 Faster RCNN 基本思想和网络结构介绍

文章目录三者的比较：RCNN、Fast RCNN、 Faster RCNN一、框架的对比1.三者都是二阶算法，网络框架比较：2.三者的优缺点比较： RCNN一、RCNN系列简介二、RCNN算法流程的4个步骤三、RCNN存在的问题四、论文解析补充1.R-CNN提出了两个问…

阅读更多...

Odoo17免费开源ERP开发技巧：如何在表单视图中调用JS类

Odoo17免费开源ERP开发技巧：如何在表单视图中调用JS类

文/Odoo亚太金牌服务开源智造老杨在Odoo最新V17新版中，其突出功能之一是能够构建个性化视图，允许用户以独特的方式与数据互动。本文深入探讨了如何使用 JavaScript 类来呈现表单视图来创建自定义视图。通过学习本教程，你将获得关于开发Odo…

阅读更多...

【ceph】配置 ceph dashboard 详细配置过程

【ceph】配置 ceph dashboard 详细配置过程

本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》： python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8…

阅读更多...

C++ QT串口通信(1)-串口模块QtSerialPort详解

C++ QT串口通信(1)-串口模块QtSerialPort详解

本文讲解C++ QT串口模块QtSerialPort。目录一、串口通信基础与QtSerialPort模块简介 1.1 串口通信基础 1.2 QtSerialPort模块简介

阅读更多...

最新文章