经典数值优化算法--专题学习

通用的损失函数最优化的数值方法,来源于泰勒展开式,多元函数的泰勒展开式为:

一、一阶逼近与一阶方法

一阶泰勒展开式:

其中,是代表了β变化的可能性,t在之后说到的梯度下降方法中演变成了学习速率。

现在,我们需要第二项最小,向量内积,最小为-|梯度||a|,这就是β的改变量。梯度的方向是函数在给定点上升最快的方向,那么梯度的反方向就是函数在给定点下降最快的方向,这正是我们所需要的。所以我们只要沿着梯度的方向一直走,就能走到局部的最低点!

于是,演变成了:

倒三角符号就是梯度。梯度是函数关于每一个自变量的偏导组成的向量。物理意义就是一个在站在某一个点上,斜率最大的那个方向。(最常见的就是二维平面上曲线的斜率)。

二、二阶逼近与牛顿法

对损失函数进行二阶展开:

损失函数取得最小值的必要条件是:

最后得到β的迭代公式:

牛顿法需要用到Hessian矩阵,是损失函数的二阶导数组成的矩阵。于是上面的公式就变成了:

牛顿法要求Hessian矩阵必须是非负定的,才能求解出局部最小值。。

ps:当Hessian矩阵非正定时,收敛到局部最大值,不定时,收敛到鞍点。

另外,如果Hessian矩阵是病态的(求解方程组时如果对数据进行较小的扰动,则得出的结果具有很大波动,这样的矩阵称为病态矩阵。用条件数来衡量,矩阵A的条件数:K(A)=‖A-1‖*‖A‖。若K很大的时候,A为病态矩阵),需要通过正则化来处理,求伪逆。则损失函数的参数更新方程:

 

转载于:https://www.cnblogs.com/melina-zh/p/9789036.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/484948.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

美国雷神公司对第六代战斗机的任务系统提出六点预测

来源:转载自公众号 “空天防务观察”图片:来源于网络编辑:朱锦锟审阅:原熙文2021年3月29日,美国雷神技术公司旗下的雷神情报与太空公司刊文,称该公司的工程师们针对可在未来“第六代”战斗机上运行的任务系…

Leetcode--394. 字符串解码(Java)

给定一个经过编码的字符串,返回它解码后的字符串。 编码规则为: k[encoded_string],表示其中方括号内部的 encoded_string 正好重复 k 次。注意 k 保证为正整数。 你可以认为输入字符串总是有效的;输入字符串中没有额外的空格,且…

人机猜拳

import java.util.Scanner;public class Person { Scanner input new Scanner(System.in); String name; int score; String action; int num; public void method() { System.out.println("\n请出拳:1.剪刀 2.石头 3.布"); boolean a true; do { num…

【专家观点】张亚勤、张宏江:人工智能的未来是什么?

来源:智能研究院“我们打造一个规模庞大的系统时,更需要具备系统思维,同时拥有动手能力、喜欢搭系统的人才……诞生至今,智源一直肩负着三项重要任务:一是构筑一个社区。二是打造一个真正适合青年科学家成长的平台。三…

Leetcode--837. 新21点(java)

爱丽丝参与一个大致基于纸牌游戏 “21点” 规则的游戏,描述如下: 爱丽丝以 0 分开始,并在她的得分少于 K 分时抽取数字。 抽取时,她从 [1, W] 的范围中随机获得一个整数作为分数进行累计,其中 W 是整数。 每次抽取都是…

python文件操作,自动关闭

with opne("text.txt", encoding"utf8") as f, open("text2.txt", encoding"utf8") as f2 : pass with代码块执行完就自动close文件、转载于:https://www.cnblogs.com/somethingintheway/p/9789650.html

近亿台物联网设备或遭劫持,这家IoT云平台遭遇“灾难性”入侵事件

来源:互联网安全内参参考来源:krebsonsecurity.com编译:安全内参近日,一位熟悉该事件内情的消息人士表示,Ubiquiti对外刻意削弱了此次事件的“灾难性”后果,希望降低对股价的打击。涉事第三方云服务商也发布…

第一范式,第二范式,第三范式,BCNF范式理解

基础知识 实体:现实世界中客观存在并可以被区别的事物。比如“一个学生”、“一本书”、“一门课”等等。值得强调的是这里所说的“事物”不仅仅是看得见摸得着的“东西”,它也可以是虚拟的,比如说“老师与学校的关系”。 属性:教…

国产光刻设备第一股:从官司缠身到国产希望?

来源:传感器技术作者:温淑编辑:心缘科创板“国产直写光刻设备第一股”正式登陆A股市场!在经过约10个月的审查后,国产半导体设备供应商合肥芯碁微装终于在4月1日正式敲钟,首次公开发行A股约3220万股&#xf…

Leetcode--1014. 最佳观光组合(java)

给定正整数数组 A&#xff0c;A[i] 表示第 i 个观光景点的评分&#xff0c;并且两个景点 i 和 j 之间的距离为 j - i。 一对景点&#xff08;i < j&#xff09;组成的观光组合的得分为&#xff08;A[i] A[j] i - j&#xff09;&#xff1a;景点的评分之和减去它们两者之间…

揭秘卫星互联网!6G关键技术,国内行业雏形初现

来源&#xff1a;智东西编辑&#xff1a; 智东西内参5G的已经全面展开商用&#xff0c;人类的通信技术再一次走上了快速发展期。未来&#xff0c;随着火箭回收、低轨卫星和6G技术的发展&#xff0c;科幻式的通信方式似乎离我们也不远了。2019 年工信部成立了 6G 研究组&#xf…

导航栏下拉至一定高度后固定在顶部的特效

js要引入jquery文件&#xff1a; <script type"text/javascript"> $(function(){var nav$("#header"), //得到导航对象win$(window), //得到窗口对象doc$(document);//得到document文档对象。//防止页面滚动到60px以下F5刷新后导航不显示   if(do…

[数据库]数据库三级加锁协议深入理解

在并发事务的执行时&#xff0c;容易引起数据不一致,有一下几种情况 丢失修改 &#xff1a;两个事务T1和T2读入同一数据并修改&#xff0c;T2提交的结果破坏了T1提交的结果&#xff0c;导致T1的修改被丢失 读脏数据 &#xff1a;事务T1对数据D进行修改&#xff0c;事务T2读取到…

一至七-----小东西

一至七-----小东西 用什么就声明什么&#xff0c;可以节约空间&#xff0c;如下&#xff1a;using std::cout using std::cin using std::endl cin和 cout 是 istream类 和 ostream类 的对象cin只能读取单词&#xff0c;如果使用cin>>name&#xff0c;输入如果是个句子即…

图灵奖得主Jeff Ullman直言:机器学习不是数据科学的全部!统计学也不是

来源&#xff1a;智源社区作者&#xff1a;Jeff Ullman编译&#xff1a;梦佳1Have we missed the boat again? 多年来&#xff0c;数据库领域有一种言论认为&#xff0c;数据库系统正在变得无关紧要。 大家似乎持一种绝望的心态。“have we missed the boat-again”这句话&…

Leetcode--1028. 从先序遍历还原二叉树(Java)

我们从二叉树的根节点 root 开始进行深度优先搜索。 在遍历中的每个节点处&#xff0c;我们输出 D 条短划线&#xff08;其中 D 是该节点的深度&#xff09;&#xff0c;然后输出该节点的值。&#xff08;如果节点的深度为 D&#xff0c;则其直接子节点的深度为 D 1。根节点的…

html-列表

<!DOCTYPE html><html lang"en"><head> <meta charset"UTF-8"> <title>Document</title></head><body><h3>你喜欢的水果&#xff1a;</h3><ul> <!-- 无序列表 --> <li>苹果…

赛迪展望 | 一文了解“2021年中国先进计算产业发展趋势”

来源&#xff1a;中国电子信息产业发展研究院内容提要人类社会的组织、生产和生活方式正伴随着计算技术创新、融合、扩散、升级&#xff0c;呈现深刻的变革趋势。计算对经济社会发展和产业能级跃升的驱动作用日益凸显。展望2021年&#xff0c;先进、新型的计算基础架构&#xf…

124. 二叉树中的最大路径和(Java)

给定一个非空二叉树&#xff0c;返回其最大路径和。 本题中&#xff0c;路径被定义为一条从树中任意节点出发&#xff0c;达到任意节点的序列。该路径至少包含一个节点&#xff0c;且不一定经过根节点。 示例 1: 输入: [1,2,3] 1 / \ 2 3 输出: 6 示例 2: 输…

物理如何证明上帝的存在?

来源&#xff1a;利维坦文&#xff1a;Monica Grady译&#xff1a;苦山校对&#xff1a;兔子的凌波微步原文&#xff1a;www.bbc.com/future/article/20210301-how-physics-could-prove-god-exists“我曾在一次研讨会上听到下面这个问题——当时我还相信上帝&#xff08;现在我…