(四)优化函数,学习速率与反向传播算法--九五小庞

多层感知器

在这里插入图片描述

梯度下降算法

  • 梯度的输出向量表明了在每个位置损失函数增长最快的方向,可将它视为表示了在函数的每个位置向那个方向移动函数值可以增长。
    在这里插入图片描述
    在这里插入图片描述
  • 曲线对应于损失函数。点表示权值的当前值,即现在所在的位置。
  • 梯度用箭头表示,表明为了增加损失,需要向右移动。此外,箭头的长度概念化地表示了如果在对应的方向移动,函数值能够增长多少。如果向着梯度的反方向移动,则损失函数的值会相应减少。

学习速率

  • 梯度就是表明损失函数相对参数的变化率,对梯度进行缩放的参数被称为学习速率(learning rate)或可称之为步长
  • 学习速率是一种超参数或对模型的一种手工可配置的设置,需要为它指定正确的值。如果学习速率太小,则找到损失函数极小值点时可能需要许多轮迭代;如果太大,则算法可能会“跳过”极小值点并且因为周期性的“跳跃”而永远无法找到极小值点。
  • 在具体实践中,可通过查看损失函数值随时间变化曲线,来判断学习速率的选取是否合适
  • 合适的学习速率,损失函数随时间下降,直到一个底部,不合适的学习速率,损失函数可能会发生震荡
    在这里插入图片描述

学习速率选取原则

  • 在调整学习速率时,既要使其足够小,保证不至于发生超调,也要保证它足够大,以使损失函数能够尽快下降,从而可通过较少次数的迭代更快的完成学习

反向传播算法

  • 反向传播算法是一种高效计算数据流图中梯度的技术,每一层的导数都是后一层的导数与前一层输出之积,这正是链式法则的奇妙之处,误差反向传播算法利用的正是这一特点。
  • 前馈时,从输入开始,逐一计算每个隐含层的输出,直到输出层。
  • 然后开始计算导数,并从输出层经各隐含层逐一反向传播。为了减少计算量,还需对所有已完成计算的元素进行复用。这便是反向传播算法名称的由来。

常见的优化函数

  • 优化器(optimizer)是编译模型的所需要的两个参数之一。
  • 可以先实例化一个优化器对象,然后将它传入model.compile(),或者你可以通过名称来调用优化器。在后一种情况下,将使用优化器的默认参数。

SGD:随机梯度下降优化器

  • 随机梯度下降优化器SGD和min-batch是同一个意思,抽取m个小批量(独立同分布)样本,通过计算他们平梯度均值。
SGD参数

在这里插入图片描述

RMSprop:网络优化算法

  • 经验上,RMSprop被证明有效且使用的深度学习网络优化算法
  • RMSprop增加了一个衰减系数来控制历史信息的获取多少,RMSprop会对学习率进行衰减。
  • 建议使用优化器的默认参数(除了学习率lr,它可以被自由调节)
  • 这个优化器你通常是训练循环神经网络RNN的不错选择。

Adam:Momentum+RMSprop

  • Adam算法可以看做是修正后的Momentum+RMSprop算法
  • Adam通常被认为对超参数选择相当鲁棒
  • 学习率建议为0.0001
  • Adam是一种可以替代传统随机梯度下降过程的一阶优化算法,它能基于训练数据迭代的更新神经网络权重。
  • Adam通过计算梯度的一阶矩估计和二阶矩估计而为不同的参数设计独立的自适应性学习率

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/715276.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GEE入门篇|图像处理(三):阈值处理、掩膜和重新映射图像

阈值处理、掩膜和重新映射图像 本章前一节讨论了如何使用波段运算来操作图像, 这些方法通过组合图像内的波段来创建新的连续值。 本期内容使用逻辑运算符对波段或索引值进行分类,以创建分类图像。 1.实现阈值 实现阈值使用数字(阈值&#xf…

PXE网络启动实战(第一篇 启动WinPE)

免责声明:文中有一些图片来源自网络,如有版权请通知我删除,谢谢! 目录 一、无盘站 二、PXE启动 三、PXE启动原理 四、启动WinPE 1、服务器准备 2、客户端 3、TFTP服务 4、WinPE选择 5、具体操作: 预告 一、无盘站 网络启动最早用于无盘系统,那时的电脑只配备软…

【python量化】多种Transformer模型用于股价预测(Autoformer, FEDformer和PatchTST等)_neuralforecast

写在前面 在本文中,我们利用Nixtla的NeuralForecast框架,实现多种基于Transformer的时序预测模型,包括:Transformer, Informer, Autoformer, FEDformer和PatchTST模型,并且实现将它们应用于股票价格预测的简单例子。 …

Libero集成开发环境中Identify应用与提高

Libero集成开发环境中Identify应用与提高 Identify的安装

小米手机相册闪退

环境: HyperOS 1.0 小米手机分身 处理步骤: 1)清理相册缓存:设置->应用设置->相册->清理数据->清除缓存(注意:别点清理全部数据;这个方法对我没用)。 2)卸…

操作系统原理与实验——实验三优先级进程调度

实验指南 运行环境: Dev c 算法思想: 本实验是模拟进程调度中的优先级算法,在先来先服务算法的基础上,只需对就绪队列到达时间进行一次排序。第一个到达的进程首先进入CPU,将其从就绪队列中出队后。若此后队首的进程的…

多租户 TransmittableThreadLocal 线程安全问题

在一个多租户项目中,用户登录时,会在自定义请求头拦截器AsyncHandlerInterceptor将该用户的userId,cstNo等用户信息设置到TransmittableThreadLocal中,在后续代码中使用.代码如下: HeaderInterceptor 请求头拦截器 public class HeaderInterceptor implements Asyn…

阿里云国际云服务器全局流量分析功能详细介绍

进行全局流量分析时,内网DNS解析会作为一个整体模块,其他模块的边缘虚框颜色会置灰,示意作为一个整体进行全局分析,左侧Region可以展开/汇总,也可以单独选中某个Region模块进行分析(这时其他Region的流量线…

【Java面试题】Redis的用途

以下是一些常见的用途 1.缓存 Redis 可以用作缓存系统,,将频繁访问的数据存储在内存中,从而加快数据访问速度,减少对数据库的访问压力。 2.消息队列 Redis 支持发布/订阅模式和列表数据结构,可以用作消息队列系统的…

道可云元宇宙每日资讯|厦门首个元宇宙办税大厅启用

道可云元宇宙每日简报(2024年3月1日)讯,今日元宇宙新鲜事有: 中国军号元宇宙发布会即将举行 近日,解放军新闻传播中心中国军号即将正式上线。中国军号元宇宙发布会也将在“云端”与您见面。全方位展现解放军新闻传播…

加密与安全_探索签名算法

文章目录 概述应用常用数字签名算法CodeDSA签名ECDSA签名小结 概述 在非对称加密中,使用私钥加密、公钥解密确实是可行的,而且有着特定的应用场景,即数字签名。 数字签名的主要目的是确保消息的完整性、真实性和不可否认性。通过使用私钥加…

云服务器购买教程

在购买云服务器之前,建议仔细评估自身需求和预算,并与多个云服务提供商进行比较,以确保选择到最适合的解决方案。购买云服务器的具体步骤可能因所选云服务提供商而异。以下以实际操作的方式介绍如何购买一款云服务器。 云服务器购买常见问题…

【数仓】zookeeper软件安装及集群配置

相关文章 【数仓】基本概念、知识普及、核心技术【数仓】数据分层概念以及相关逻辑【数仓】Hadoop软件安装及使用(集群配置)【数仓】Hadoop集群配置常用参数说明 一、环境准备 准备3台虚拟机 Hadoop131:192.168.56.131Hadoop132&#xff…

【Spring连载】使用Spring Data访问 MongoDB----对象映射之基于类型的转换器

【Spring连载】使用Spring Data访问 MongoDB----对象映射之基于类型的转换器 一、自定义转换二、转换器消歧(Disambiguation)三、基于类型的转换器3.1 写转换3.2 读转换3.3 注册转换器 一、自定义转换 下面的Spring Converter实现示例将String对象转换为自定义Email值对象: R…

蓝桥杯_定时器的综合应用实例

一 工程 代码 在单片机训练平台上,利用定时器T0,数码管模块和2个独立按键(J5的2,3短接),设计一个秒表,具有清零,暂停,启动功能。 显示模式:分-秒-0.05秒&…

Linux进程——信号详解(上)

文章目录 信号入门生活角度的信号技术应用角度的信号用kill -l命令可以察看系统定义的信号列表信号处理常见方式概述 产生信号通过键盘进行信号的产生,ctrlc向前台发送2号信号通过系统调用异常软件条件 信号入门 生活角度的信号 你在网上买了很多件商品&#xff0…

前端面试练习24.3.2-3.3

HTMLCSS部分 一.说一说HTML的语义化 在我看来,它的语义化其实是为了便于机器来看的,当然,程序员在使用语义化标签时也可以使得代码更加易读,对于用户来说,这样有利于构建良好的网页结构,可以在优化用户体…

vue3项目中如何一个vue组件中的一个div里面的图片铺满整个屏幕样式如何设置

在Vue 3项目中,要使一个div内的图片铺满整个屏幕,你需要确保几个关键点:div元素和图片元素的样式设置正确,以及确保它们能够覆盖整个视口(viewport)。以下是一个简单的步骤和代码示例,帮助你实现…

代码随想录算法训练营第四八天 | 买股票

目录 只买卖一次可买卖多次 LeetCode 121. 买卖股票的最佳时机 LeetCode 122. 买卖股票的最佳时机II 只买卖一次 给定一个数组 prices ,它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。 你只能选择 某一天 买入这只股票,并选择在 未来的某…

浏览器输入URL到页面渲染经历了哪些过程?

浏览器输入URL到页面渲染的过程可以分为以下几个步骤: 解析URL:当用户在浏览器的地址栏输入URL后,浏览器会首先解析这个URL,判断其是否合法。查找缓存:浏览器会查看自己的缓存,判断是否有之前访问过的这个U…