反向传播算法学习笔记

反向传播算法(Back propagation)

目的及思想

我们现在有一堆输入,我们希望能有一个网络,使得通过这个网络的构成的映射关系满足我们的期待。也就是说,我们在解决这个问题之前先假设,这种映射可以用网络的模型来比较好的描述。为什么是网络而不是什么别的形式呢?不懂了。。

这个网络到底是个怎样的形式呢?如下图所示,\(i1,i2\)是输入,\(o1,o2\)是输出,其中\(w1...w8, b1, b2\)是这个网络中的参数。对于一个结点来说,它的所有输出都等于它的每个输入,对于对应\(w\)的加权求和带入激活函数的结果。
853467-20160630141449671-1058672778.png-140.9kB

而现在\(w1...w8, b1, b2\)这些参数都是未知的,我们希望能通过一些方法逼近这些参数的真实结果。

我们将\(w1...w8, b1, b2\)这些参数,考虑成一个高维空间中的点,与三维还有二维的情况类似的,我们贪心的朝着周围都走一小步,找到那个能获得相对最优解的方向,并接受这次移动,这是经典的梯度下降的思想。于是,我们引入了损失函数,使用它来描述这个点的优秀程度。\(w1...w8, b1, b2\)是这个函数的输入,通过调整这些输入,我们希望能获得一个使得损失函数获得最值的位置,然而实际上,我们获得的显然是一个极值,并不一定是最值,除非能证明这个损失函数关于这些参数是凸的。但是,作为一个比较优秀的解,这样做还是有价值的。

后半部分的思想过程顺理成章,感觉整套方法最有价值和启发意义的就是这个网络模型。

具体算法

  1. 设定输入量\(i_1,i_2...i_n\),以及\(w_1...w_{n*n*2}, b_1, b_2\),如果可能尽量设定在离真实解较近的位置,最好在一个坑里?
  2. 激活函数选取经典的sigmoid函数 \(f(x) = \frac{1}{1+e^{-x}}\)
  3. 损失函数取 \(L(w_1...w_{n*n*2}, b_1, b_2) = \frac{1}{2} \sum_{i=1}^n (target_j - o_j)^2\), 我们定义\(i_j\)对应的目标输出为\(target_j\)
  4. 对于当前网络带入\(i_1,i_2...i_n\),求出对应的\(o_1,o_2,...,o_n\). 这个过程显然就是在一张dag上按照拓扑序递推更它的后继节点即可,每到一个点计算它的激活函数的输出,然后更新它的后继节点
  5. 更新完之后,我们就获得了\(o_1,o_2,...,o_n\). 现在需要求解 L 关于这每个参数的在当前输入情况下的偏导。容易利用链式法则解决(懒得写了)这里有超详细推导
    一文弄懂神经网络中的反向传播法——BackPropagation
  6. 返回操作 4,直到获得令人满意的精度

代码

c++写了个实现。太丑了不发了。。最麻烦的部分就是链式求导算梯度的几个式子推导,有了式子之后还是挺好写的。非常有意思的是,一开始的写法,没有加入参数 b1,b2,因此迭代 500000 次左右才能使L达到 1e-22 的精度,但是当我们,补上 b1 和 b2 时,只用迭代 200000 次即可达到,一个式子形式的设计或者说网络结构的设计,对于算法的效果影响还是很巨大的。

转载于:https://www.cnblogs.com/RRRR-wys/p/10873130.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/320406.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AT1219-歴史の研究(历史研究)【回滚莫队】

正题 题目链接:https://www.luogu.com.cn/problem/AT1219 题目大意 nnn个数字,mmm次询问一个区间内ti∗it_i*iti​∗i的最大值,tit_iti​即区间内iii的出现次数。 解题思路 用回滚莫队的思想,对于在不同块中的询问,我们把左端点…

求树的直径

欢迎来踩本人博客 树的直径: 就是树上最长路 方法 : 求两边DFS即可 步骤: 1.从任意一点进行dfs,然后找到一个最长路径,记录最远点u 2.然后从u再进行dfs,找最长路径,记录一点v。 (u&…

【暴力】MSWORLD

MSWORLD 题目大意: 在一个图上有n个点,现在问你最远的两个点的直线距离的平方是多少 输入样例 4 0 0 0 1 1 1 1 0输出样例 2样例解释: 农场1(0,0)和农场3(1,1)的距离为 2的开方。 数据范…

微软技术直通车(第三期) 之 人工智能

编者:有幸本周在北京,大家有空来现场面基。微软技术直通车本系列活动密切关注微软及周边相关技术。以微软云计算和相关产品为依托,涉及云计算、数据处理、开发工具、商用软件、物联网、人工智能等前沿科技。系列活动邀请微软技术专家、一线开…

SDOI2018 物理实验

SDOI2018 物理实验 题意:二维平面上有一条直线,直线上放置了一个激光发射器,会向导轨两侧沿导轨垂直方向发射宽度为 L 的激光束。平面上还有 n 条线段,并且线段和线段、线段和直线之间都没有公共点,线段和直线的夹角不…

P2485-[SDOI2011]计算器【BSGS,exgcd,快速幂】

正题 题目链接:https://www.luogu.com.cn/problem/P2485 题目大意 给出a,b,pa,b,pa,b,p要求一下一种 ab%pa^b\% pab%p的值ax≡b(modp)ax\equiv b(\mod p)ax≡b(modp)的最小非负整数解ax≡b(modp)a^x\equiv b(\mod p)ax≡b(modp)的最小非负整数解 解题思路 一道缝合题 第一个…

幸运数字Ⅱ

牛客网 时间限制:C/C 1秒,其他语言2秒 空间限制:C/C 262144K,其他语言524288K 64bit IO Format: %lld 题目描述 定义一个数字为幸运数字当且仅当它的所有数位都是4或者7。 比如说,47、744、4都是幸运数字而5、17、467都…

【背包】SMRTFUN

SMRTFUN 题目大意: 有n件物品,每件物品有各自的a值和b值,现在让你选一些物品,在a、b都不是负数的情况下,使a、b值之和最大 输入样例 5 -5 7 8 -6 6 -3 2 1 -8 -5输出样例 8样例说明 选择第1,3和4号牛…

Visual Studio 2017 15.8 正式发布,测试速度提高 82%

Visual Studio 2017 15.8 版本已正式发布:发行说明:https://docs.microsoft.com/zh-cn/visualstudio/releasenotes/vs2017-relnotes#15.8下载地址:https://visualstudio.microsoft.com/downloads/安装现可选择在开始安装之前下载所有安装文件…

Codeforces 1176F

Codeforces 1176F 题目 题意:T组物品,按顺序选一个一个选,物品首先要满足组间的相对顺序,每个物品有价值和体积,每组选择的体积不能超过3,组内的选择物品的顺序可以调整,在总的物品的顺序中&…

jzoj5702-[gdoi2018day2]滑稽子图【树形dp,二项式定理】

正题 题目大意 nnn个点的一棵树,定义f(S)f(S)f(S)表示点集SSS的生成子图中的边数量。 求∑S∈Vf(S)k\sum_{S\in V}f(S)^kS∈V∑​f(S)k 解题思路 因为kkk很小,所以可以考虑一下二项式拆解,我们需要快速的计算出(ab)k(ab)^k(ab)k&#xff0c…

【每日一题】4月9日题目精讲 Running Median

文章目录题目&#xff1a;题意&#xff1a;题解一&#xff1a;题解二&#xff1a;题目&#xff1a; –>链接<— 时间限制&#xff1a;C/C 5秒&#xff0c;其他语言10秒 空间限制&#xff1a;C/C 65536K&#xff0c;其他语言131072K 64bit IO Format:%lld 题目描述 For t…

【结论】区间和的和

区间和的和 题目大意&#xff1a; 给出一个数组&#xff0c;求出所有区间和的总和 输入样例&#xff1a; 3 1 2 3输出样例&#xff1a; 20数据范围&#xff1a; 对于30%的数据&#xff1a;1⩽n⩽1001\leqslant n\leqslant 1001⩽n⩽100 对于50%的数据&#xff1a;1⩽n⩽1…

.NET Core 2.1中的HttpClientFactory最佳实践

ASP.NET Core 2.1中出现一个新的HttpClientFactory功能&#xff0c;它有助于解决开发人员在使用HttpClient实例从其应用程序发出外部Web请求时可能遇到的一些常见问题。介绍在.NETCore平台的2.1新增了HttpClientFactory&#xff0c;虽然HttpClient这个类实现了disposable&#…

树学

文章目录题目描述题解1&#xff1a;代码:题解2&#xff1a;代码&#xff1a;传送时间限制&#xff1a;C/C 2秒&#xff0c;其他语言4秒 空间限制&#xff1a;C/C 262144K&#xff0c;其他语言524288K 64bit IO Format:> %lld 题目描述 牛妹有一张连通图&#xff0c;由n个点…

jzoj5701-[gdoi2018day2]谈笑风生【莫比乌斯反演,二分,最短路】

正题 题目大意 nnn个点&#xff0c;每个点有一个wiw_iwi​&#xff0c;mmm条边&#xff0c;对于一条边(x,y)(x,y)(x,y)&#xff0c;边权为∑i1wx∑j1wy[gcd(i,j)1](ij)\sum_{i1}^{w_x}\sum_{j1}^{w_y}[gcd(i,j)1](ij)i1∑wx​​j1∑wy​​[gcd(i,j)1](ij) 选择一个最小的PPP使得…

csp-2019 复赛游记

文章目录Day0Day\ 0Day 0Day1Day\ 1Day 1Day2Day\ 2Day 2总结:csp−J:csp-J:csp−J:csp−s:csp-s:csp−s:遥远的梦想&#xff1a;Day0Day\ 0Day 0 早上&#xff0c;在运动会上乱搞一波&#xff0c;然后在10点左右到了机房&#xff0c;然后发现巨佬几枚&#xff0c;远看似在认证…

Rainbond v3.7.0:实现企业级PaaS的稳定性

Rainbond v3.7.0&#xff1a;实现企业级PaaS的稳定性Rainbond在v3.7.0版本中释出了大量平台稳定性更新&#xff0c;并在应用管理功能、安全性和系统安装三方面进行了部分优化。作为IT基础系统平台&#xff0c;Rainbond从低耦合的架构设计、高可用的部署方式、自恢复与容错的设计…

简单多边形三角化(暴力)

简单多边形三角化(暴力) 说在前面 网上流传着各种神奇的多边形三角剖分算法&#xff0c;但是讲道理&#xff0c;实现难度太高了。。。也没有搜到其他人的实现。这里写个最暴力的做法。。随机数据验证没问题&#xff0c;欢迎 hack 实现 一个简单多边形的耳朵定义为&#xff1a;如…

牛客网【每日一题】4月13号 Accumulation Degree

文章目录题目描述样例分析&#xff1a;题意&#xff1a;题解&#xff1a;代码&#xff1a;本题目传送题目树学是这个题的简易版&#xff0c;也涉及换根问题&#xff0c;可以先看看这个 树学 时间限制&#xff1a;C/C 1秒&#xff0c;其他语言2秒 空间限制&#xff1a;C/C 32768…