【学习心得】神经网络知识中的符号解释②

        我在上篇文章中初步介绍了一些神经网络中的符号,只有统一符号及其对应的含义才能使我自己在后续的深度学习中有着一脉相承的体系。如果对我之前的文章感兴趣可以点击链接看看哦:

【学习心得】神经网络知识中的符号解释①icon-default.png?t=N7T8http://t.csdnimg.cn/f6PeJ

一、神经网络简单模型

        今天我以逻辑回归任务为例来介绍更多神经网络中的符号和他们对应的概念解释。先看一个超简单的神经网络模型:

        这个模型对应了一个公式:

\left.\begin{matrix} x\\ w\\ b \end{matrix}\right\}\Rightarrow z=w^Tx+b

 x是你输入的特征。w是权重,b是偏置,他们统称参数。我们可以将逻辑回归的模型再精细一点:

        可见中间这个点,其实是有两个部分组成,第一个部分是线性部分,第二个部分是非线性部分。z是线性回归部分的输出,a是激活函数的输出。他们合在一起组成了逻辑回归的输出\hat y。可以写成如下公式:

\left.\begin{matrix} x\\ w\\ b \end{matrix}\right\}\Rightarrow z=w^Tx+b\Rightarrow a=\sigma (z)\Rightarrow L(a,y)

        公式中的\sigma是Sigmoid函数(激活函数的一种),L是损失函数(Loss Function)。好的介绍到这里我来个表格给大家复习一下:

符号解释
x特征值向量 x=[x_1,x_2,x_3]^T
z线性回归方程
\sigmaSigmoid激活函数
L损失函数
w权重向量 w=[w_1,w_2,w_3]^T
b偏置,偏置是一个标量在计算的时候被广播

二、两层神经网络

        不废话,直接看图:

        从图中可知,我们有三个输入特征x_1,x_2,x_3他们被竖起来堆叠,这叫做神经网络的输入层。中间有两个虚线,其中处最后一个外,统称隐藏层。而最后一个虚线部分(这层只有一个节点)叫做输出层。

        我们还用之前的公式和符号来表示这个神经网络模型,但稍有不同:

\left.\begin{matrix} x\\ W^{[1]}\\ b^{[1]} \end{matrix}\right\}\Rightarrow z^{[1]}=W^{[1]}x+b^{[1]}\Rightarrow a^{[1]}=\sigma (z^{[1]})

        我们使用上角标中括号里面写数字的形式来表示第几层神经网络^{[m]}。这里要和之前的小括号里面写数字的形式区分开来^{(i)}它表示第i个训练样本。可见上面这个公式只写出了第1层神经网络的公式。接下来我们把第二层也写出来:

\left.\begin{matrix} a^{[1]}\\ W^{[2]}\\ b^{[2]} \end{matrix}\right\}\Rightarrow z^{[2]}=W^{[2]}a^{[1]}+b^{[2]}\Rightarrow a^{[2]}=\sigma (z^{[2]})\Rightarrow L(a^{[2]},y)

        和上面的第1层比较类似,我就不赘述。上面我介绍了两层神经网络的正向传播,接下来要介绍反向传播的公式:

\left.\begin{matrix} da^{[1]}=d\sigma(z^{[1]})\\ dW^{[2]}\\ db^{[2]} \end{matrix}\right\}\Leftarrow dz^{[2]}=d(W^{[2]}a^{[1]}+b^{[2]})\Leftarrow da^{[2]}=d\sigma(z^{[2]})

\Leftarrow dL(a^{[2]},y)

        这里面要解释的符号,就是da它是每一层逻辑回归输出的梯度,dz它是每一层线性回归输出的梯度,dW是每一层权重的梯度,db是每一层偏置的梯度。

好啦,让我再用一个表格为大家总结一下:

符号解释
^{[m]}上角标中括号里面写数字,代表第m层
W偏置w的行向量形式,即w^T
a^{[0]}第0层的输出,其实就是输入层的特征值向量x
da^{[i]}i层输出的梯度
dz^{[i]}i层线性回归输出的梯度
dW^{[i]}i层权重的梯度
db^{[i]}i层偏置的梯度

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/815244.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

3. 安装arrach结构的Mysql

提示:arm的centos上面安装arrach结构的Mysql 文章目录 前言一、查看已经安装过的并卸载mysql二、创建mysql用户组1.设置用户组2. 安装3.设置启动4.查看密码5.修改登录密码6.授权7.修改连接8.设置参数 常见问题排查1. 启动失败查看:2. 用户操作3. 踩坑解决…

Leetcode刷题-字符串详细总结(Java)

字符串 字符串可能在算法处理上面和数组是类似的,但是String和数组的数据结构还是有一些不一样的 1、反转字符串 344. 反转字符串 - 力扣(LeetCode) 双指针的经典应用,两个指针同时向中间移动 public void reverseString(char[…

fail2ban检查配置自动黑名单策略

安装 fail2ban 更新系统包索引(以 Ubuntu/Debian 为例): sudo apt update安装 fail2ban: sudo apt install fail2ban基本配置 复制默认配置文件: fail2ban 的默认配置文件位于 /etc/fail2ban/jail.conf。为避免升级软件…

扣子Coze插件教程:如何使用Coze IDE创建插件

🧙‍♂️ 诸位好,吾乃斜杠君,编程界之翘楚,代码之大师。算法如流水,逻辑如棋局。 📜 吾之笔记,内含诸般技术之秘诀。吾欲以此笔记,传授编程之道,助汝解技术难题。 &#…

爬虫 BeautifulSoup模块

爬虫 BeautifulSoup模块 【一】介绍 【1】说明 BeautifulSoup库是python的一个第三方库,主要用于处理HTML和XML文档他提供了一些简单的、python式的函数来解析、导航、搜索以及修改分析树,使得从网页抓取的数据变得简单高效BeautifulSoup自动将输入文…

华大基因获证:氧化三甲胺检测试剂助力心血管疾病早期干预

近日,深圳华大基因股份有限公司旗下的全资子公司华大生物科技(武汉)有限公司获得两项医疗器械注册证(注册号:鄂械注准20232404470和鄂械注准20232404469)。该试剂是国内首个获批二类注册的,基于…

2024第十五届蓝桥杯 Java B组 填空题

声明:博主比较菜,以下均为个人想法。解决方法仅供参考。欢迎大家一起讨论交流! 第一题: 题目: (简洁版)从小到大排列是20或24倍数的正整数,前10个数依次是:”20 24 40 …

L1-047 装睡

你永远叫不醒一个装睡的人 —— 但是通过分析一个人的呼吸频率和脉搏,你可以发现谁在装睡!医生告诉我们,正常人睡眠时的呼吸频率是每分钟15-20次,脉搏是每分钟50-70次。下面给定一系列人的呼吸频率与脉搏,请你找出他们…

多线程(50)如何实现自旋锁

自旋锁是一种忙等锁,当线程尝试获取锁而锁已被其他线程持有时,该线程会在一个循环中不断尝试获取锁,直到成功为止。与传统的互斥锁相比,自旋锁不会使线程进入睡眠状态,因此如果等待锁的时间非常短,自旋锁的…

LWIP2.1.3+UCOSIII3.08的系统接口arch.c修改

自己的笔记不保证正确 err_t sys_mbox_trypost_fromisr(sys_mbox_t *mbox, void *msg) {BaseType_t ret;BaseType_t xHigherPriorityTaskWoken pdFALSE;LWIP_ASSERT("mbox ! NULL", mbox ! NULL); // LWIP_ASSERT("mbox->mbx ! NULL", mbox->mbx …

C#WPF的XAML中String回车换行

本文实例演示C#WPF的XAML中String回车换行。 在XAMl中回车换行与C#中的不同,使用\r\n不再起作用。 首先使用String需要先添加引用 xmlns:sys="clr-namespace:System;assembly=mscorlib" 回车使用
或者 换行使用
或者 同时使用时需要添加 xml:…

mac ip 域名 三者之间的关系

mac ip 域名 三者之间的关系 在计算机网络中,MAC地址(Media Access Control Address)、IP地址(Internet Protocol Address)和域名(Domain Name)是三个不同的概念,它们之间有以下关系…

Linux进阶篇:文件传输工具curl命令详解

文件传输工具Linux curl命令详解 一 curl命令介绍 在Linux中curl是一个利用URL规则在命令行下工作的文件传输工具,可以说是一款很强大的http命令行工具。它支持文件的上传和下载,是综合传输工具,但按传统,习惯称url为下载工具。…

package.java文件的作用

你查看springboot的源码,有很多类都有这个文件,在idea不能创建,因为不支持这种命名,只能用记事本创建后复制都项目中。 主要应用是给类添加正常,或者把公用的注解都放到这里,常量不合适,作用范…

在Qt平台上的网络应用编程原理

前言 在网络通信方面的应用编程需要使用套接字(Socket),如在构建网站的服务器、游戏的服务器时。Qt提供了跨平台的类库QTcpServer、QTcpSocket及QUdpSocket供程序员使用,具体用途如下。 QTcpServer用于传输控制协议/网际协议(Transmission Control Proto…

竞赛 基于CNN实现谣言检测 - python 深度学习 机器学习

文章目录 1 前言1.1 背景 2 数据集3 实现过程4 CNN网络实现5 模型训练部分6 模型评估7 预测结果8 最后 1 前言 🔥 优质竞赛项目系列,今天要分享的是 基于CNN实现谣言检测 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐&am…

欧姆龙61F系列液位开关使用教程(补水和排水)

欧姆龙61F系列液位开关使用教程(补水和排水) 本文以61F-LS-CP11-NRA型号的液位开关为例进行说明: 具体的选型文档可参考以下链接中的内容: OMRON欧姆龙-无浮标开关(紧凑插入型)61F-LS液位开关-选型样本说明 补水功能(供水) 如下图所示, 电机电源为3相AC220V; 控制电…

SSRF+Redis未授权getshell

SSRFRedis未授权getshell 1.前言 当一个网站具有ssrf漏洞,如果没有一些过滤措施,比如没过滤file协议,gophere协议,dict等协议,就会导致无法访问的内网服务器信息泄露,甚至可以让攻击者拿下内网服务器权限 …

Git分布式版本控制系统——Git常用命令(二)

五、Git常用命令————分支操作 同一个仓库可以有多个分支,各个分支相互独立,互不干扰 分支的相关命令,具体如下: git branch 查看分支 git branch [name] 创建分支&#x…

5. Mysql的binlog介绍

参考:InnoDB学习(三)之BinLog 1. BinLog介绍 BinLog又称为二进制日志,是MySQL服务层的数据日志,MySQL所有的存储引擎都支持BinLog。 BinLog记录了MySQL中的数据更新和可能导致数据更新的事件,可以用于主从…