深度学习第三次课-梯度下降与反向传播

news/2025/7/6 14:24:18/文章来源:https://blog.csdn.net/flying_all/article/details/51559213

梯度下降

损失函数可视化

得分函数 f=W*X

损失函数 c=W*X-y

目标损失函数最小最优化过程

可视化

一维

二维热力图

如果损失函数是一个凸函数，例如SVM。

凸函数正系数加和=凸函数

神经网络 costfunction 非凸因为系数有正有负。

凸优化与最优化

神经网络最优化方法是梯度下降。梯度下降策略有：

1 随机搜索。随机生成一组权重，与之前的loss相比，小了，就是更更好的权重。

2 随机局部搜索。在现有权重的周围随机生成一组权重。选择最优权重。

3 顺着梯度下滑。梯度方向是函数增长最快的方向。随意顺梯度下降，就是最快能到达最小值的方式。梯度下降是初始值敏感的，不同的初始值可能到达的最小值点不同。一般使用高斯分布的随机小值。

梯度下降

梯度下降有两种解决。数值梯度和解析梯度。

数值梯度是按照导数公式 f(x0)' = (f(x0+h) - f(x0))/h ,h是一个非常小的数。数值梯度解法简单，但是计算和参数呈线性关系，计算量大。

解析法：速度快，但是容易出错。利用f(x)导函数 f(x)' 计算梯度。

梯度下降的实现过程中有批处理、随机梯度、min-batch梯度下降。

梯度下降要理解梯度方向需要弄明白梯度方向三垂线几个概念。我记录一点杂乱的东西在这里。

梯度：函数增长最快的方向。

梯度方向是等值曲线的法向量。是函数在某一点的变化率和变化方向。在一维函数的时候，梯度方向和

反向传播

反向转播是一个求偏导的过程。

链式法则

把 f(x,y,z)=(x+y)*z 在给定一个具体值的时候画一个网络结构图试试吧。前向计算每一步的得分。向后计算每一步的导数。

Sigmoid例子和公式推导

这个公式推导真心没推导出来。继续加油。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/425123.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

[Leetcode][第1025题][JAVA][除数博弈][数学][递推]

[Leetcode][第1025题][JAVA][除数博弈][数学][递推]

【问题描述】[中等] 【解答思路】 1. 数学证明找规律时间复杂度：O(1) 空间复杂度：O(1) 2. 递推时间复杂度：O(N) 空间复杂度：O(1) class Solution {public boolean divisorGame(int N) {boolean[] f new boolean[N 5];f[1]…

阅读更多...

《App后台开发运维与架构实践》第2章 App后台基础技术

《App后台开发运维与架构实践》第2章 App后台基础技术

2.1 從App業務邏輯中提煉API接口　　　　業務邏輯思維導圖　　　　功能-業務邏輯思維導圖　　　　基本功能模塊關系　　　　功能模塊接口UML（設計出API）　　　　在設計稿標注API　　　　編寫API文檔　　　　2.2 設計API的要點　　　　根據對象設計API　　…

阅读更多...

[Leetcode][第410题][JAVA][分割数组的最大值][动态规划][二分]

[Leetcode][第410题][JAVA][分割数组的最大值][动态规划][二分]

【问题描述】[中等] 【解答思路】 1. 动态规划第 1 步：设计状态令 f[i][j] 表示将数组的前 i 个数分割为 j 段所能得到的最大连续子数组和的最小值。 （ i ≥ j ） 第 2 步：状态转移方程第 3 步：考虑初始化 f[i][…

阅读更多...

深度学习第二课--图像识别与KNN

深度学习第二课--图像识别与KNN

图像分类的难点视角不同尺寸不同变形光影背景干扰同类内的差异例如躺椅、座椅、图像识别的核心数据驱动学习。就像人看过很多猫以后，就知道什么是猫。把很多同一类的图片“喂给”计算机，让计算机自己去学习该类图片的特征。之后做出评估。KNN解决…

阅读更多...

Vasya and Multisets CodeForces - 1051C 模拟|分类讨论

Vasya and Multisets CodeForces - 1051C 模拟|分类讨论

题意：把数组分成两个集合每个集合中元素数量为1的个数相同（此个数可以是0） 分析： 这类问题就是要各种可能情况考虑到然后分类讨论完整地正确分类就AC 否则gg 如果数量为1的元素数为偶数个对半分如果元素数量…

阅读更多...

centos安装多个tomcat

centos安装多个tomcat

1.参考前文安装jdk、第一个tomcat 2.安装第二个tomcat后，修改/etc/profile vi /etc/profile #tomcat1　　export CATALINA_BASE/opt/tomcat1　　export CATALINA_HOME/opt/tomcat1　　export TOMCAT_HOME/opt/tomcat1 #tomcat2　　export CATALINA_BASE2/opt/tomcat…

阅读更多...

[小技巧][Java]Arrays.fill() 初始化二维数组

[小技巧][Java]Arrays.fill() 初始化二维数组

Arrays.fill()并不能提高赋值的效率，在函数的内部也是用for循环的方式实现的。 fill()函数源码： public static void fill(Object[] a, Object val) {for (int i 0, len a.length; i < len; i)a[i] val;}for (int i 0; i < n; i) {Arrays.fil…

阅读更多...

Grid game CodeForces - 1104C 放格子|思维|找规律

Grid game CodeForces - 1104C 放格子|思维|找规律

题意：4*4的格子中输入0放 2*1的图案输入1放1*2的图案当摆满一行或一列后此行列图案清空就想毛熊方块一样分析：开始感觉很唬人要搜索还是要dp啥的后来发现原来2*1就放左下 1*2就放左上然后来啥清空啥就能够循环不断地放下去然后变成了一道巨水题…

阅读更多...

团队开发之团队介绍

团队开发之团队介绍

团队名：又双叒叕队团队口号：Bug不死，我们不休！ 团队成员：符满迪该团队成员拥有个人公众平台，对公众平台的运营有良好的实践经验。而且具有较好的编程能力，精通Java语言，对微信小程序…

阅读更多...

数据结构与算法分析

数据结构与算法分析

本系列的笔记基于七月算法的《求职面试》课程以及《数据结构域算法分析-java语言描述》第2版，做学习笔记。以下是这系列的目录。每个专题只做笔记，不求每个专题都要深入到很深很深。算法分析表栈队列并查集哈希表树堆图论递归深度优…

阅读更多...

[算法][算法复杂度]常用算法复杂度速查表

[算法][算法复杂度]常用算法复杂度速查表

复杂度通常会使用大 -O记号来表示，比如快速排序的平均时间复杂度是 O(nlog(n))。虽然我们应该做「理解派」，但是即使每个算法/数据结构都理解了，不时仍有可能忘记具体某个算法/数据结构的复杂度（特别是在最好、最坏和平均情形下的…

阅读更多...

十张伟大的科学瞬间

十张伟大的科学瞬间

题图： 搭载 ORBCOMM OG2-M1 卫星的猎鹰 9 号运载火箭发射，人类一直很渺小。 ▎2019 更新北京时间 2019 年 4 月 10 日 21 点，人类首张黑洞照片正式发布！ 这次的直接成像除了帮助我们直接确认了黑洞的存在，同时也通过模…

阅读更多...

为什么gets如此危险？

为什么gets如此危险？

这一段搬运自stackoverflow: Why is gets() dangerous The first internet worm (the Morris Internet Worm) escaped about 30 years ago (1988-11-02), and it used gets() and a buffer overflow as one of its methods of propagating from system to system. The basic pr…

阅读更多...

[Leetcode][第329题][JAVA][矩阵中的最长递增路径][DFS][拓扑排序]

[Leetcode][第329题][JAVA][矩阵中的最长递增路径][DFS][拓扑排序]

【问题描述】[中等] 【解答思路】 1. 记忆化深度优先搜索复杂度 class Solution {public int[][] dirs {{-1, 0}, {1, 0}, {0, -1}, {0, 1}};public int rows, columns;public int longestIncreasingPath(int[][] matrix) {if (matrix null || matrix.length 0 || matri…

阅读更多...

code1928: 日期差值技巧模拟

code1928: 日期差值技巧模拟

1928: 日期差值时间限制: 1 Sec 内存限制: 32 MB 题目描述有两个日期，求两个日期之间的天数，如果两个日期是连续的我们规定他们之间的天数为两天。输入有多组数据，每组数据有两行，分别表示两个日期，形式为YYYYMMD…

阅读更多...

第二十八期:阿里云VS腾讯云谁才是中国未来的云计算之王？

第二十八期:阿里云VS腾讯云谁才是中国未来的云计算之王？

阿里云早在 2009 年就已经开始布局云计算领域，具有先发优势。据统计，40% 的中国 500 强企业、近一半中国上市公司、80% 中国科技类公司是阿里云的客户。而腾讯云基于腾讯自身在游戏、视频、社交、出行等业务的强势地位，一路奋起直追&#xff…

阅读更多...

[小技巧][JAVA][转换]字符数组char[]与字符串String之间互相转换

[小技巧][JAVA][转换]字符数组char[]与字符串String之间互相转换

1.字符数组转为字符串方法1：直接在构造String时转换。 char[] data {‘a’, ‘b’, ‘c’}; String str new String(data);方法2：调用String类的方法转换。 String s String.valueOf(char[] ch)2.字符串转为字符数组情况一：如果是”a…

阅读更多...

CentOS 7 Apache服务的安装与配置（转）

CentOS 7 Apache服务的安装与配置（转）

https://blog.51cto.com/13525470/2070375 一、Apache简介 Apache 是一个知名的开源Web服务器。早期的Apache服务器由Apache Group来维护，直到1999年6月Apache Group在美国德拉瓦市成立了非盈利性组织的公司，即Apache软件基金会（Apache Softw…

阅读更多...

第二十九期:全球首部AI交响变奏曲问世，AI技术应用再拓边界

第二十九期:全球首部AI交响变奏曲问世，AI技术应用再拓边界

人工智能技术，史上第一次升级到了复杂音乐的创作领域：交响曲。全球首部 AI 交响变奏曲《我和我的祖国》，昨晚已由深圳交响乐团全球首演，它的出品方是中国平安人工智能研究院。此前，你可能了解过 Google 的 Magenta、…

阅读更多...

[小技巧][JAVA][转换]整型int与字符串String相互转换

[小技巧][JAVA][转换]整型int与字符串String相互转换

字符串转换整型String - >Int 1). int i Integer.parseInt([String]); 或者 //radix 进制 int i Integer.parseInt([String],[int radix]); //intValue() 输出int数据。 2). int i Integer.valueOf(String).intValue(); 或者 int i Integer.valueOf(String);整型转换字…

阅读更多...

最新文章