2.2.3机器学习—— 判定梯度下降是否收敛 + α学习率的选择

2.2.3机器学习—— 判定梯度下降是否收敛 + α学习率的选择

news/2025/4/26 17:06:22/文章来源:https://blog.csdn.net/weixin_46228946/article/details/135450201

2.2.3 判定梯度下降是否收敛 + α学习率的选择

2.1、判定梯度下降是否收敛

有两种方法，如下图：

在这里插入图片描述

方法一：
- 如图，随着迭代次数的增加，J(W,b)损失函数不断下降
- 当 iterations = 300 之后，下降的就不太明显了 / 基本是一条直线了。这时我们就说，==> “梯度下降已经收敛了”
方法二：
- 设置一个阈值 ε，这里我们让ε = 0.001 （自己设置的，但有的时候也掌握不好这个值是多少）。当J（w,b）下降值 < ε 时，我们就认为他已经收敛了
最后：还是推荐方法一

2.2 如何设置学习率 α

1、常见的情况：

情况一：说明代码出现bug / α学习率选择太大了

在这里插入图片描述

情况二：学习率α太大了

在这里插入图片描述

情况三：这是一个正常的情况，但是当迭代次数过多也可能说明α学习率选择较小

在这里插入图片描述

情况四：学习率太大了/代码的问题，你把每次更新w 写成w = w +… 应该是减法

在这里插入图片描述

2、选择 α 学习率的方法：

首先选择从 0.0001 0.01 0.1 1 10 依次去尝试，当发现学习率α的值过大时（J（W,b）损失函数发生上弹）。
再进行从最后一次正常的α值（出现损失函数J(w,b)上弹之前的值），依次迭代乘3去尝试
最后选择一个比较好的值

**第一步：**首先选择从 0.0001 0.01 0.1 1 10 依次去尝试，当发现学习率α的值过大时（J（W,b）损失函数发生上弹）。

在这里插入图片描述

第二步：再进行从最后一次正常的α值（出现损失函数J(w,b)上弹之前的值），依次迭代乘3去尝试。然后可以以此类推。最后收敛后，选择最合适的α值。

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/610189.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

赋能智慧农业生产，基于YOLOv3开发构建农业生产场景下油茶作物成熟检测识别系统

赋能智慧农业生产，基于YOLOv3开发构建农业生产场景下油茶作物成熟检测识别系统

AI赋能生产生活场景，是加速人工智能技术落地的有利途径，在前文很多具体的业务场景中我们也从实验的角度来尝试性地分析实践了基于AI模型来助力生产生活制造相关的各个领域，诸如：基于AI硬件实现农业作物除草就是一个比较熟知的场景…

阅读更多...

paddle指定运行gpu

paddle指定运行gpu

在PaddlePaddle中指定使用GPU进行运行非常简单。首先，确保你的机器上已经安装了CUDA和cuDNN，并且正确配置了GPU环境。然后，按照以下步骤进行操作： 导入PaddlePaddle库： import paddle设置使用的设备为GPU&#xff1a…

阅读更多...

【数字图像处理】水平翻转、垂直翻转

【数字图像处理】水平翻转、垂直翻转

图像翻转是常见的数字图像处理方式，分为水平翻转和垂直翻转。本文主要介绍 FPGA 实现图像翻转的基本思路，以及使用紫光同创 PGL22G 开发板实现数字图像水平翻转、垂直翻转的过程。目录 1 水平翻转与垂直翻转 2 FPGA 布署与实现 2.1 功能与指标定义 …

阅读更多...

Amazing OpenAI API：把非 OpenAI 模型都按 OpenAI API 调用

Amazing OpenAI API：把非 OpenAI 模型都按 OpenAI API 调用

分享一个有趣的小工具，10MB 身材的小工具，能够将各种不同的模型 API 转换为开箱即用的 OpenAI API 格式。让许多依赖 OpenAI API 的软件能够借助开发者能够接触到的，非 OpenAI 的 API 私有部署和使用起来。写在前面这个小工具软件写于两…

阅读更多...

ChatGPT知名开源项目有哪些

ChatGPT知名开源项目有哪些

ChatGPT-Next-Web：基于ChatGPT API的私有化部署网页聊天系统主要功能： 只需在 1 分钟内即可在 Vercel 上一键免费部署，支持私有服务器快速部署，支持使用私有域名支持ChatGPT3.5、4等常见模型Linux/Windows/MacOS 上的紧凑型客户…

阅读更多...

Ribbon学习思维导图

Ribbon学习思维导图

参考资料 1、OpenFeign与Ribbon源码分析总结与面试题 2、万字剖析OpenFeign整合Ribbon实现负载均衡的原理 3、扒一扒Nacos、OpenFeign、Ribbon、loadbalancer组件协调工作的原理 4、OpenFeign原来是这么基于Ribbon来实现负载均衡的

阅读更多...

第18集《佛法修学概要》

第18集《佛法修学概要》

戊五、结示法要请大家打开讲义第四十四页。我们讲因果同时，借缘显现。从因果转变的角度，佛教是说“罪从心起将心忏，心若灭时罪亦亡。”那么我们要知道，业是怎么来的？怎么会有业？为什么苹果掉下来&#x…

阅读更多...

DEATHNOTE: 1

DEATHNOTE: 1

首先通过kali使用nmap进行主机发现发现IP地址为192.168.75.129的主机发现其22端口和80端口开放对其进行详细扫描发现其操作系统是Linux 4.15 - 5.6 访问192.168.75.129：80会重定向到另一个页面修改一下kali的/ect/hosts的添加一句192.168.75.129 deathnote.v…

阅读更多...

【Vue3】2-8 : 条件渲染与列表渲染及注意点

【Vue3】2-8 : 条件渲染与列表渲染及注意点

本书目录：点击进入一、条件渲染 - v-if 表达式 1.1 真值与假值 1.2 v-if ，v-else-if ，v-else 1.3 实战：isShow1 为真值时显示 bbbbb ＞ 代码 ＞ 效果二、列表渲染 - v-for 2.1 渲染 - 数组 &…

阅读更多...

Spring基于注解的AOP控制事务

Spring基于注解的AOP控制事务

首先在.xml中开启sprong对注解事务的支持 applicationContext.xml <tx:annotation-driven transaction-manager"transactionManager"/> 然后再Service中加上注解 service Service Transactional(readOnlytrue,propagation Propagation.SUPPORTS) public cl…

阅读更多...

聊聊PowerJob的IdGenerateService

聊聊PowerJob的IdGenerateService

序本文主要研究一下PowerJob的IdGenerateService IdGenerateService tech/powerjob/server/core/uid/IdGenerateService.java Slf4j Service public class IdGenerateService {private final SnowFlakeIdGenerator snowFlakeIdGenerator;private static final int DATA_CE…

阅读更多...

Vue-11、Vue计算属性

Vue-11、Vue计算属性

Vue计算属性是Vue实例的属性，用来根据已有的数据进行计算得到新的数据。计算属性的值会根据它的依赖缓存起来，在依赖没有发生改变时直接返回缓存的值，提高了性能。计算属性的定义方式为在Vue实例中使用computed关键字，并将计算属…

阅读更多...

Guava：Range 区间范围工具

Guava：Range 区间范围工具

简介 Range 表示一个间隔或一个序列。它被用于获取一组数字/串在一个特定范围之内。可比较类型的区间API，包括连续和离散类型。 Range 定义了连续跨度的范围边界，这个连续跨度是一个可以比较的类型(Comparable type)。比如1到100之间的整型数据。在数…

阅读更多...

安全防御之备份恢复技术

安全防御之备份恢复技术

随着计算机和网络的不断普及，人们更多的通过网络来传递大量信息。在网络环境下，还有各种各样的病毒感染、系统故障、线路故障等，使得数据信息的安全无法得到保障。由于安全风险的动态性，安全不是绝对的，信息系统不可能…

阅读更多...

【Unity】UniTask(异步工具)快速上手

【Unity】UniTask(异步工具)快速上手

UniTask(异步工具) 官方文档：https://github.com/Cysharp/UniTask/blob/master/README_CN.md URL:https://github.com/Cysharp/UniTask.git?pathsrc/UniTask/Assets/Plugins/UniTask 优点：0GC，可以在任何地方使用为Unity提供一个高性能&…

阅读更多...

(Matlab)基于CNN-GRU的多输入分类(卷积神经网络-门控循环单元网络)

(Matlab)基于CNN-GRU的多输入分类(卷积神经网络-门控循环单元网络)

目录一、程序及算法内容介绍： 基本内容： 亮点与优势： 二、实际运行效果： 三、部分程序： 四、完整代码数据分享： 一、程序及算法内容介绍： 基本内容： 本代码基于Matlab平台编译…

阅读更多...

雍禾医疗启动“毛发森林”公益计划为地球种植“发际线”

雍禾医疗启动“毛发森林”公益计划为地球种植“发际线”

不久前，由雍禾植发、新华网及中国绿化基金会三方共同发起的 “毛发森林地球生发计划”在内蒙古自治区阿拉善盟额济纳旗揭牌启动,此计划将陆续在西部严重沙化地区植下十万棵梭梭树改善荒漠化地区环境。据悉,早在2023年3月,雍禾植发就主动与新华网一起启动“让美好生…

阅读更多...

Rabbitmq 消息可靠性保证

Rabbitmq 消息可靠性保证

1、简介消息的可靠性投递就是要保证消息投递过程中每一个环节都要成功，本文详细介绍两个环节的消息可靠性传递方式：1）、消息传递到交换机的 confirm 模式；2）、消息传递到队列的 Return 模式。消息从 producer 到 ex…

阅读更多...

Msa全球最新研究:多系统萎缩特效药全球最新进展？

Msa全球最新研究:多系统萎缩特效药全球最新进展？

多系统萎缩，是一种以神经系统为主的遗传性疾病，典型症状表现为运动障碍、自主神经功能障碍和认知障碍等。对于这种疾病，西医目前尚未有明确的根治办法，大多数医生只能通过药物缓解患者的症状，但无法彻底治愈。然而&a…

阅读更多...

轮排索引相关知识

轮排索引相关知识

轮排索引（Round Robin Index）是一种数据结构，通常用于分布式系统中的索引管理。基本思想是将索引分为多个块，并循环地轮流在这些块中存储键值对，以实现负载均衡。这样可以防止某个特定块的负载过重，使得系…

阅读更多...

最新文章