为什么机器学习中梯度下降是减去斜率，而不是按照其数学意义减去斜率的倒数

为什么机器学习中梯度下降是减去斜率，而不是按照其数学意义减去斜率的倒数

web/2025/10/23 21:29:12/文章来源:https://blog.csdn.net/kiramario/article/details/145361367

做个简单假设，Loss函数的某一个参数的函数曲线是二次方程，其导数函数为 $r = 2 * w$

按照斜率意义来看，要减去斜率倒数

在这里插入图片描述
降低LOSS需要将w1更新为w2，所以更新公式为 $\frac{\Delta L}{\Delta w}$ ， $\Delta L$ 可以看成学习率。比如取0.01，斜率为 $2 * w$ 模拟如下

结果：
在这里插入图片描述

可以看到在第三次下降的时候，损失函数反而增大，并且w越过本该取的使LOSS最小的0值，沦为负值。

引起如此原因就是随着LOSS接近最小值，其对应的斜率变小，其倒数就变得越大，也就是说，越靠近最小值，调整幅度越大，关键时刻变得冒进起来。

替换成减去斜率

当我们将更新公式替换成 $\Delta L * (2 * w)$

def w_refesh_1(w):return w - (0.1 * (2 * w)) #唯一区别

结果：
在这里插入图片描述

可以看到损失函数越来越小，w也未过界。

也就是说，斜率越大，就越远离最小值，此时就可以稍微大胆点进行调整，越靠近最小值，斜率越小，调整幅度随之变小，关键时刻变得谨慎起来。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/web/67109.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

iptables和ipvs差异

iptables和ipvs差异

iptables和ipvs都是Linux内核中用于网络流量管理的工具，它们在实现方式、功能、性能以及使用场景上存在一些显著的差异。以下是对两者的详细比较： 一、实现方式 iptables： 基于Netfilter框架。使用链表（chain）和规则&…

阅读更多...

Effective C++ 规则51：编写 new 和 delete 时需固守常规

Effective C++ 规则51：编写 new 和 delete 时需固守常规

1、背景在 C 中，如果你需要为类自定义 new 和 delete，必须遵循一些约定和规则，以确保内存管理的一致性、可维护性和安全性。当我们使用 new 和 delete 操作时，C 编译器会： 调用全局或类特定的 operator new 来分配内…

阅读更多...

JS面相对象小案例：自定义安全数组

JS面相对象小案例：自定义安全数组

在JS中，数组不像其他语言（java、python）中那样安全，它具有动态性和弱类型性，切越界访问没有具体的报错，而是返回空，为提升数组的安全性，我们可以自行定义一个安全数组。一、增加报…

阅读更多...

本地大模型编程实战(02)语义检索(2)

本地大模型编程实战(02)语义检索(2)

文章目录准备按批次嵌入加载csv文件，分割文档并嵌入测试嵌入效果总结代码上一篇文章： 本地大模型编程实战(02)语义检索(1) 详细介绍了如何使用 langchain 实现语义检索，为了演示方便，使用的是 langchain 提供的内存数据库。在实…

阅读更多...

windows平台intel-vpl编译

windows平台intel-vpl编译

需要先在本机编译好opencl库 git clone --recursive https://github.com/KhronosGroup/OpenCL-SDK.git cmake -A x64 -T v143 -D OPENCL_SDK_BUILD_OPENGL_SAMPLESOFF -B OpenCL-SDK\build -S OpenCL-SDKcmake --build OpenCL-SDK\build --config Releasecmake --install O…

阅读更多...

Vue 3 30天精进之旅：Day 05 - 事件处理

Vue 3 30天精进之旅：Day 05 - 事件处理

引言在前几天的学习中，我们探讨了Vue实例、计算属性和侦听器。这些概念为我们搭建了Vue应用的基础。今天，我们将专注于事件处理，这是交互式Web应用的核心部分。通过学习如何在Vue中处理事件，你将能够更好地与用户进行交互&#…

阅读更多...

[C语言日寄]exit函数的使用及其拓展

[C语言日寄]exit函数的使用及其拓展

【作者主页】siy2333 【专栏介绍】⌈c语言日寄⌋：这是一个专注于C语言刷题的专栏，精选题目，搭配详细题解、拓展算法。从基础语法到复杂算法，题目涉及的知识点全面覆盖，助力你系统提升。无论你是初学者，还是…

阅读更多...

React 中hooks之useSyncExternalStore使用总结

React 中hooks之useSyncExternalStore使用总结

1. 基本概念 useSyncExternalStore 是 React 18 引入的一个 Hook，用于订阅外部数据源，确保在并发渲染下数据的一致性。它主要用于： 订阅浏览器 API（如 window.width）订阅第三方状态管理库订阅任何外部数据源 1.1 基…

阅读更多...

激光雷达和相机早期融合

激光雷达和相机早期融合

通过外参和内参的标定将激光雷达的点云投影到图像上。 • 传感器标定首先需要对激光雷达和相机（用于获取 2D 图像）进行外参和内参标定。这是为了确定激光雷达坐标系和相机坐标系之间的转换关系，包括旋转和平移。通常采用棋盘格等标定工具&…

阅读更多...

Linux--权限

Linux--权限

Linux系统的权限管理是保障系统安全的重要机制，以下详细讲解权限相关概念及操作指令： 一、基础权限机制 1. 权限的三元组，读（r）、写（w）、执行（x） 每个文件或目录有三组…

阅读更多...

iic、spi以及uart

iic、spi以及uart

何为总线？ 连接多个部件的信息传输线，是部件共享的传输介质总线的作用？ 实现数据传输，即模块之间的通信总线如何分类？ 根据总线连接的外设属于内部外设还是外部外设将总线可以分为片内总线和片外总线可分为数…

阅读更多...

“破冰”探索两周年，AI和媒体碰撞出了什么火花？

“破冰”探索两周年，AI和媒体碰撞出了什么火花？

2022年末，大模型浪潮席卷而来。在“所有行业都值得用AI重塑”的氛围下，各个行业都受到了影响和冲击。其中新闻媒体可以说是受影响最为剧烈的行业。因为内容的生产方式被重新定义，媒体从业者普遍存在焦虑情绪：担心错过新一轮的…

阅读更多...

DeepSeek明确学术研究方向效果如何？

DeepSeek明确学术研究方向效果如何？

明确学术研究方向在学术写作中，选择一个出色的研究主题至关重要，因为它直接关系到论文是否能登上高级别的学术期刊。不少学者在这个过程中走入了误区，他们往往将大把的时间花在写作本身，而忽略了对选题的深入思考，这…

阅读更多...

WPF实战案例 | C# WPF实现大学选课系统

WPF实战案例 | C# WPF实现大学选课系统

WPF实战案例 | C# WPF实现大学选课系统一、设计来源1.1 主界面1.2 登录界面1.3 新增课程界面1.4 修改密码界面二、效果和源码2.1 界面设计（XAML）2.2 代码逻辑（C#） 源码下载更多优质源码分享作者：xcLeigh 文章地址&a…

阅读更多...

《 C++ 点滴漫谈：二十四》深入 C++ 变量与类型的世界：高性能编程的根基

《 C++ 点滴漫谈：二十四》深入 C++ 变量与类型的世界：高性能编程的根基

摘要本文深入探讨了 C 中变量与类型的方方面面，包括变量的基本概念、基本与复合数据类型、动态类型与内存管理、类型推导与模板支持，以及类型系统的高级特性。通过全面的理论讲解与实际案例分析，展示了 C 类型系统的强大灵活性与实践价值。…

阅读更多...

STM32 GPIO配置点亮LED灯

STM32 GPIO配置点亮LED灯

本次是基于STM32F407ZET6做一个GPIO配置，实现点灯实验。新建文件 LED.c、LED.h文件，将其封装到Driver文件中。双击Driver文件将LED.c添加进来编写头文件，这里注意需要将Driver头文件声明一下。在LED.c、main.c里面引入头文件LED.h LED初…

阅读更多...

window保存好看的桌面壁纸

window保存好看的桌面壁纸

1、按下【WINR】快捷键调出“运行”窗口，输入以下命令后回车。 %localappdata%\Packages\Microsoft.Windows.ContentDeliveryManager_cw5n1h2txyewy\LocalState\Assets 2、依次点击【查看】【显示】，勾选【隐藏的项目】，然后按【CtrlA】全部…

阅读更多...

TCP 三次握手四次挥手

TCP 三次握手四次挥手

目录 TCP 三次握手 1. SYN (Synchronize：同步) 2. SYN-ACK (Synchronize Acknowledge：同步确认) 3. ACK (Acknowledge：确认) 为什么是三次而不是两次或四次？ 三次握手的作用 TCP 四次挥手第一次挥手：客户端发送 FIN …

阅读更多...

C语言初阶牛客网刷题—— HJ34 图片整理【难度：中等】

C语言初阶牛客网刷题—— HJ34 图片整理【难度：中等】

1. 题目描述牛客网在线OJ链接 Lily上课时使用字母数字图片教小朋友们学习英语单词，每次都需要把这些图片按照大小（ASCII码值从小到大）排列收好。请大家给Lily帮忙，通过C语言解决。输入描述：Lily使用的图片包括 “A…

阅读更多...

MVCC底层原理实现

MVCC底层原理实现

MVCC的实现原理了解实现原理之前，先理解下面几个组件的内容 1、当前读和快照读先普及一下什么是当前读和快照读。当前读：读取数据的最新版本，并对数据进行加锁。例如：insert、update、delete、select for update、 sele…

阅读更多...

最新文章