AI学习记录 - 导数在神经网络训练中的作用(自己画的图,很丑不要介意!)

导数的作用

我们去调整神经网络的权重,一般不会手动去调整,如果只有很少的神经元,人工调整确实可以实现,当我们有几十层,一层几百上千个神经元的时候,人工调整就不可能了。
一个权重的调整涉及到两个问题,一个是调大还是调小,一个是调整的幅度。

快速理解导数在神经网络上的意义

导数是什么,就是求解某个变量对于结果的影响程度,当变量多的时候,我们就把其他变量当成常数,在求导数的过程中把它略掉。如下:
y = 2x1 + 3x2 + 10x3
x1对y的影响程度是2
X2对y的影响程度是3
X3对y的影响程度是10
然后调整权重,就是调整2,3,10这些数字,如果数字过大,我们就适当调小一点,例如把10调整成5,越大的数字调整的幅度就应该越大。
凡是变量x存在的,都是求某一个点的变化率。

恰好导数的这种意义可以应用到神经网络里面,因为需要求解每一个神经元节点对于最终结果的影响。

在这里插入图片描述

下面的输出值y,公式为y = w1x1 + w2x2 + w3*x3 + b,我们要求解w1,w2,w3,b对于结果的影响,这就是为什么我们需要用到数学上的导数的原因。
在这里插入图片描述

简单的导数以及链式求导

导数的简单公式计算,瞬时变化率就是导数。
y=3x ,导数是3,是一条直线,所以处处的变化率是一样的。
y=3x^2,导数是3x,x取某一个值,因为x的平方是曲线,不同位置的变化率是不一样。
y=3x3,导数是3x2,x取某一个值,因为x的平方是曲线,不同位置的变化率是不一样。

导数的链式求导,为什么神经网络会引入链式求导?首先我们必须知道链式求导是什么?
如下图,我们输入一个x经过多重神经元,会变成这样,这就是一个复合函数:
在这里插入图片描述
复合函数需要使用链式求导法则进行求解

最简单的链式求导

在这里插入图片描述

链式求导的多链路概念

我们求解z对于w1的导数的时候,有很多链路可以求,一个可靠的方法是将所有的链路求解出来,全部相加起来,就得出了w1的导数。
在这里插入图片描述

误差函数

在这里插入图片描述

每种误差函数的优点:
均方误差:对误差进行平方,取平方有一个特性,它惩罚更大的错误更多,但是同时异常值对结果的影响也很大。
在这里插入图片描述

均方根误差:RMSE 的优点是对较大误差值有较大的惩罚,因为它对差异值进行了平方操作。这可以避免较大误差值对拟合度的影响过大。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/49328.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TCP的FIN报文可否携带数据

问题发现: 发现FTP-DATA数据传输完,TCP的挥手似乎只有两次 实际发现FTP-DATA报文中,TCP层flags中携带了FIN标志 piggyback FIN 问题转化为 TCP packet中如果有FIN flag,该报文还能携带data数据么? 答案是肯定的 RFC7…

Go协程的运行机制以及并发模型

进程与线程 进程与线程都是os用来运行程序的基本单元。其中进程是正在执行的程序的实例,它包含了程序代码、数据、文件和系统资源等。进程是os资源分配的基本单元,每个进程都有自己独立的地址空间、文件描述符、网络连接、进程ID等系统资源。进程与进程…

【LeetCode:3098. 求出所有子序列的能量和 + 记忆化缓存】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

【北京迅为】《i.MX8MM嵌入式Linux开发指南》-第三篇 嵌入式Linux驱动开发篇-第四十七章 字符设备和杂项设备总结回顾

i.MX8MM处理器采用了先进的14LPCFinFET工艺,提供更快的速度和更高的电源效率;四核Cortex-A53,单核Cortex-M4,多达五个内核 ,主频高达1.8GHz,2G DDR4内存、8G EMMC存储。千兆工业级以太网、MIPI-DSI、USB HOST、WIFI/BT…

connect-multiparty中间件用法以及实例--文件上传中间件(保姆级别教学)

connect-multiparty中间件的用法包括安装和引入、基本设置、路由应用、文件处理以及安全和优化等步骤。 connect-multiparty是一个专为Connect和Express框架设计的文件上传中间件,它基于multiparty库,用于处理多部分表单数据,尤其针对文件上传…

pytorch中的zero_grad()执行时机

在反向传播(backward())前执行即可 zero_grad() 用以清除优化器的梯度对张量执行backward(),以计算累积梯度执行optimizer.step(),优化器使用梯度更新参数当优化器更新完成,梯度即失去意义,即可以清除,为保证下一次梯度开始累积时为0,则在下一次执行反向传播前清除即可

sqlalchemy使用json_unquote函数的mysql like查询

sqlalchemy使用json_unquote函数的mysql like查询 在SQLAlchemy中使用json_unquote函数查询MySQL JSON字段可以通过使用func函数来实现。下面是一个示例,假设有一个名为users的表,其中包含一个名为data的JSON字段,我们想要查询该字段的内容: from sqlalchemy import crea…

Redis核心技术与实战学习笔记

Redis核心技术与实战学习笔记 最近想沉下心来看下redis,买了蒋德钧老师的《Redis 核心技术与实战》,这里记录一些学习笔记 希望能够坚持下去有想一起学习的童鞋,可以点击跳转到文章尾部获取学习资源,仅供学习不要用于任何商业用途!!! redis知识全景图 …

前端JS特效第50集:zyupload图片上传

zyupload图片上传,先来看看效果: 部分核心的代码如下(全部代码在文章末尾): var operimg_id; var zoom_rate100; var zoom_timeout; function rotateimg(){var smallImg$("#"operimg_id);var numsmallImg.attr(curr_rotate);if(nu…

ESP8266用AT指令实现连接MQTT

1准备工作 硬件(ESP8266)连接电脑 硬件已经烧入了MQTT透传固件 2实现连接 2-1(进入AT模式) 打开串口助手发送如下指令 AT 2-2(复位) ATRST 2-3(开启DHCP,自动获取IP&#x…

免费视频批量横版转竖版

简介 视频处理器 v1.3 是一款由是貔貅呀开发的视频编辑和处理工具,提供高效便捷的视频批量横转竖,主要功能: 导入与删除文件:轻松导入多个视频文件,删除不必要的文件。暂停与继续处理:随时暂停和继续处理。…

C# Math.Ceiling方法向上取整和Math.Floor方法向下取整

Math.Ceiling方法向上取整 用于对指定的双精度浮点值进行向上取整。这意味着它会返回大于或等于指定数字的最小整数。如果数字是整数,则Math.Ceiling将返回该整数本身。 double number1 3.13; double number2 5.0; double number3 -2.72;double result1 Math.…

Python学习笔记43:游戏篇之外星人入侵(四)

前言 在前面的文章中,我们已经对项目进行了简单的分析,并且已经编写好了基础的代码,接下来的工作就是进一步的分析游戏的业务功能,在基础代码之上,进行填充。 背景颜色 我们简单的创建窗口以后,除了命名…

php如何处理和表设计,不同商家的多商品订单,如何进行拆单和费用处理?

在处理不同商家的多商品订单时,拆单和费用处理是一个复杂但重要的任务。在PHP中进行订单处理和表设计。 数据库表设计 用户表 (users) idnameemail等等 商家表 (vendors) idnamecontact_info等等 商品表 (products) idnamepricevendor_id (外键,关联商…

设置使用小米google play和APK的下载使用

我们常常遇到从google play无法下载apk文件,被迫从APKcombo和APKpure两个网站下载安装文件,可是安装文件在手机google play服务框架未开启时即使安装好了,也没法用。也需要把google play服务框架安装好,下面分别介绍: …

Mac 中安装内网穿透工具ngrok

ngrok 是什么? Ngrok 是一个网络工具,主要用于在网络中创建从公共互联网到私有或本地网络中运行的web服务的安全隧道。它充当了一个反向代理,允许外部用户通过公共可访问的URL访问位于防火墙或私有网络中的web应用程序或服务。Ngrok 特别适用…

Three.js 官方文档学习笔记

Address:Three.js中文网 (webgl3d.cn) Author:方越 50041588 Date:2024-07-19 第一个3D案例—创建3D场景 创建3D场景对象Scene: const scene new THREE.Scene(); 创建一个长方体几何对象Geometry: const geomet…

实验八: 彩色图像处理

目录 一、实验目的 二、实验原理 1. 常见彩色图像格式 2. 伪彩色图像 3. 彩色图像滤波 三、实验内容 四、源程序和结果 (1) 主程序(matlab (2) 函数FalseRgbTransf (3) 函数hsi2rgb (4) 函数rgb2hsi (5) 函数GrayscaleFilter (6) 函数RgbFilter 五、结果分析 1. …

某数据泄露防护(DLP)系统NetSecConfigAjax接口SQL注入漏洞复现 [附POC]

文章目录 某数据泄露防护(DLP)系统NetSecConfigAjax接口SQL注入漏洞复现 [附POC]0x01 前言0x02 漏洞描述0x03 影响版本0x04 漏洞环境0x05 漏洞复现1.访问漏洞环境2.构造POC3.复现某数据泄露防护(DLP)系统NetSecConfigAjax接口SQL注入漏洞复现 [附POC] 0x01 前言 免责声明:请…

硬盘取证(电子数据取证)

硬盘取证是电子数据取证的一个重要分支,涉及对硬盘驱动器(包括传统硬盘HDD、固态硬盘SSD等)进行调查,以收集、保存、分析和呈现与法律案件或安全事件有关的电子证据。硬盘取证的目标是确保收集的证据在法庭上具有可接受性和可靠性…